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(57) Abstract: The invention relates to 
a device for the automatic determination 
of nucleic acid sequences. The sequencing 
reaction occurs by the parallel sequential 
construction of the strands complementary 
to individually- fixed single-strand nucleic 
acid chains. The automatic sequencing 
carries out said sequential construction 
and detects electromagnetic radiation from 
individual marked nucleotides (NT*s) 
incorporated in the complementary strands. 
The sequence of the immobilised nucleic 
acid chain is determined from the order of 
the incorporated NT*s. 

(57) Zusammenfassung: Gegenstand der 
Brfindung ist ein GerMt zur automatischen 
Ermittlung von Nukleinsauresequenzen. 
Die sequenzierungsreaktion erfolgt durch 
den parallelen sequentieUen Aufbau der 
zu einzelnen fixierten einzelstrangigen 
NukleinsMureketten komplementfiren 
Strange. Der Sequenzierautomat rural 
diesen sequentieUen Aufbau durch 
und detektiert elektromagnetische 
Strahlung von einzelnen, markierten in 
die komplementare Strange eingebaaten 
Nukleotiden (NT*s). A us der Reihenfolge 
der eingebauten NT*s wird die Sequenz 
der immobilisierten NukleinsSureketten 
bestimmL 
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GerSt zur Sequenzierung von Nukleinsauremolekulen 



Beschreibung 



5 Einfuhrung: 

Gegenstand der Erfindung ist ein GerSt zur automatischen Ermittlung von 
Nukleinsauresequenzen. Die Sequenzierungsreaktion erfolgt durch den parallelen 
sequentiellen Aufbau der zu einzelnen fixierten einzelstrangigen Nukleinsaureketten 
komplementaren Strange. Der Sequenzierautomat fflhrt diesen sequentiellen 
0 Aufbau durch und detektiert elektromagnetische Strahlung von einzelnen, 
markierten in die komplementare Strange eingebauten Nukleotiden (NTs). Aus der 
Reihenfolge der eingebauten NTs wird die Sequenz der immobilisierten 
Nukleinsaureketten bestimmt. 



15 

1. Abkurzungen und Begriffserlauterungen 

DNA - Desoxyribonukleinsaure verschiedenen Ursprungs und unterschiedlicher 
Lange: (genomische DNA, cDNA, ssDNA, dsDNA) 

20 

RNA - Ribonukleinsaure (meist mRNA) 

Polymerasen - Enzyme, die komplementare Nukleotide in einen wachsenden DNA- 
oder RNA-Strang einbauen konnen (z.B. DNA-Polymerasen, Reverse- 
25 Transkriptasen, RNA-Polymerasen) 

■ 

dNTP - 2'-Desoxy-Nucleosid-Triphosphate als Substrate fur DNA-Polymerasen und 
Reverse-Transkriptasen 



NT - naturiiches Nukleotid, meist dNTP, wenn nicht ausdrOcklich anders 
gekennzeichnet. 

Die AbkQrzung "NT" wird auch bei der Langenangabe einer Nukleinsauresequenz 
verwendet, z.B. 1.000 NT. In diesem Fall stent "NT 1 fur Nukleosid-Monophosphate. 
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lm Text wird bei AbkQrzungen die Mehrzahl durch Verwendung des Suffixes n s" 
gebildet, "NT" steht zum Beispiel fur "Nukleotid", "NTs" steht fur mehrere 
Nukleotide. 

5 NT* - ein mit einem Fluoreszenzfarbstoff und einer zur Termination fuhrenden 
Gruppe reversibel modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrOcklich 
anders gekennzeichnet. NT*s bedeutet: modifizierte Nukleotide 

NSK - steht fur eine Nukleinsaurekette (DNA oder RNA). NSKs bedeutet mehrere 
10 unterschiedliche oder identische NukleinsSureketten. NSKs schlie&en z.B. 
einzelstrangige oder doppelstrangige Oligo- oder Polynukleotide, genomische DNA, 
Populationen von cDNAs oder mRNAs ein. 

NSKF - Nukleinsaurekettenfragment, NSKFs - Nukleinsaurekettenfragmente. 
15 Fragmente von NSKs (DNA oder RNA), die nach einem Fragmentierungsschritt 

# 

entstehen. Der Sequenzierautomat kann sowohl fur die Analyse von NSKs als auch 
von NSKFs verwendet werden. Ein wesentlicher Unterschied zwischen NSKs und 
NSKFs besteht in der Vorbereitung des Materials und in der Analyse der 
gewonnenen Sequenzen. In der Sequenzierungsreaktion und im Ablauf der 
20 Verfahrensschritte bestehen keine groBe Unterschiede, so dass viele 
Verfahrensschritt gemeinsam fQr NSKs und NSKFs beschrieben werden. 

Plane Oberflache: Oberflache, die vorzugsweise folgende Merkmale aufweist: 1) Sie 
erlaubt, mehrere einzelne MolekQIe, vorzugsweise mehr als 100, noch besser mehr 
25 als 1000, mit dem jeweiligen gegebenen Objektrv-Oberflache-Abstand bei einer 
Objektivposrtion gleichzeitig zu detektieren. 2) Die immobilisierten einzelnen 
MolekOle befinden sich in derselben Fokusebene, die reproduzierbar eingestellt 
werden kann. 

30 Definition der Termination: Als Termination wird in dieser Anmeldung der reversible 
Stop des Einbaus der modifizierten NTs bezeichnet. Die modifizierten NTs tragen 
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eine reversibel angekoppelte zur Termination fQhrende Gruppe. Diese Gruppe kann 
von den eingebauten NTs entfernt werden. 

Dieser Begriff ist von dem Oblichen Gebrauch des Wortes "Termination" durch 
Dideoxy-NTP bei einer konventionellen Sequenzierung zu unterscheiden. 

5 

Genprodukte - mRNA-Transkripte oder von der mRNA abgeleitete 
Nukleinsaureketten (z.B. einzelstrangige cDNA, von einzelstrangiger cDNA 
synthetisierte doppelstrangige cDNA, von cDNA abgeleitete RNA oder von cDNA 
amplifizierte DNA). Genprodukte k6nnen auch als Gensequenzaquivalente 
10 bezeichnet werden. 

SNP - single nucleotide polymorphism 
PBS - Primerbindungsstelle 

15 

Objektfeld - ein Teil der Reaktionsoberflache, der bei einer definierten X,Y- 
Einstellung des Objektivs durch die Kamera abgebildet werden kann. 

Sequenzierungsreaktion - Summe einzelner Verfahrensschritte bis zum Ergebnis: 
20 den ermittelten Sequenzen von einzelnen auf der festen Oberflache immobilisierten 
NSKs. 

DPuMA - Deutsches Patent- und Markenamt 

« 

25 2. Stand der Technik 

Die am haufigsten verwendete Technik zur Analyse von Nukleinsauresequenzen ist 
die Didesoxysequenzierung nach Sanger. Dabei werden markierte 
Nukleinsaurekettenfragmente nach ihrer Lange in einem Gel aufgetrennt. Ein 
Beispiel eines solchen Sequenzierautomaten ist in EP 0294524 beschrieben. Dieser 
30 Sequenzierautomat kann bis zu 100 Sequenzen gleichzeitig analysieren. 
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ln der vorliegenden Erfindung wird ein Sequenzierapparat prSsentiert, der Qber 
100.000 Nukleinsauresequenzen parallel analysieren kann und somit deutlich 
grfi&ere Sequenziergeshwindigkeit aufweist im Vergleich zu einem „Stand der 
Technik" Sequenzierapparat. Dieser Sequenzierautomat ermoglicht sowohl 
5 qualitative Analyse von Sequenzen (Sequenzierung im engeren Sinne) als auch 
eine quantitative Analyse (Auswertung der Anzahl von bestimmten Sequenzen, z.B. 
bei Genexpressionsanalyse). 

Ein solcher Sequenzierautomat kann in vielen Bereichen, z.B. in der Medizin, der 
Pharmazie und der Biotechnologie eingesetzt werden kann. 

10 

3. allgemeine Beschreibung 

Ein wesentlicher Gegenstand dieser Erfindung ist ein Gerat, ein 
Sequenzierautomat, zur automatischen parallelen Identifizierung von 
Nukleinsauresequenzen. Der erfindungsgemaBe Sequenzierautomat kann mehrere 

15 hunderttausend einzelner immobilisierter Nukleinsaurenketten parallel 
sequenzieren. Eine de novo Sequenzierung von Nukleinsaurenketten, eine Analyse 
von Sequenzvarianten Oder auch eine Genexpressionsanalyse sind mit dem 
beschriebenen Sequenzierautomaten moglich. Dadurch stellt dieser 
Sequenzierautomat einen Universalautomaten fOr die Analyse von 

20 Nukleinsauresequenzen dar. 

Wesentliche Teile des erfindungsgemaden Sequenzierautomates sind: 

- ein Gehause, 

- ein optisches System mit Lichtquelle, Filtervorrichtung, 
25 - Detektionsvorrichtung, 

- eine Reaktionsplattform, 

- ein Translationssystem (Scantisch), 

- und ein Computersystem fQr die Steuerung einzelner Schritte des 
Sequenzierungsvorgangs und die Signalanalyse. 

30 Ein schematisches Beispiel fQr den Sequenzierautomaten ist in Fig. 1 dargestellt. 



I 
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Die Sequenzierungsreaktion erfolgt durch den sequentiellen Aufbau der zu den 
einzelnen fixierten einzelstrSngigen NukleinsSureketten komplementaren Strange. 
Der Sequenzierautomat fOhrt diesen sequentiellen Aufbau durch und detektiert 
elektromagnetische Strahlung (Fluoreszenzsignale) von einzelnen, markierten in die 
5 komplementaren Strange eingebauten Nukleotiden (NT*s). 

Beispiele einer solchen Sequenzierungsreaktion sind in den Anmeldungen 
Tcherkassov et al. („Verfahren zur Bestimmung der Genexpression" DPuMA- 
Aktenzeichen 101 20 798.0-41, „Verfahren zur Analyse von Nukleinsaureketten" 
DPuMA-Aktenzeichen 101 20 797.2-41, lf Verfahren zur Analyse von 
10 Nukleinsaurekettensequenzen und der Genexpression" DPuMA-Aktenzeichen 101 
42 256.3) beschrieben. Die Sequenzierungsreaktion schlielit im wesentlichen 
folgende Schritte ein: 

1) Vorbereitung for zyklische Schritte, bestehend aus: 

15 a) einer Probenvorbereitung, bei der einzelstrSngige Nukleinsaureketten 

(NSKs) mit einer LSnge zwischen 20 und 5000 NT, vorzugsweise zwischen 50 und 
1000 NT, bereitgestellt und gegebenenfalls mit einer PBS versehen werden, bei 
langeren Sequenzen wird ein Fragmentierungsschritt durchgeftihrt, so dass NSKFs 
entstehen. 

20 b) eiriem Fixierungsschritt der vorbereiteten NSK-Probe an die 

Reaktionsoberflache in Form von NSK-Primer-Komplexen bzw. NSKF-Primer- 
Kompexen. Dabei werden einzelne NSKs bzw. NSKFs auf der Reaktionsoberflache 
in einer solchen Weise fixiert, daB eine enzymatische Reaktion (Synthese des 
komplementSren Stranges) an diesen MolekOlen ablaufen kann, s. Beispiel 

25 Immobilisation. 

2) Nach der Fixierung der NSKs bzw. NSKFs in Form von NSK-Primer-Komplexen 
bzw. NSKF-Primer-Komplexen startet man mit alien auf der Oberflache 
immobilisierten Komplexen die zyklischen Schritte. Als Grundlage der 

30 Sequenzierung dient die Synthese des komplementSren Stranges zu jeder 
einzelnen fixierten NSK bzw. NSKF. Dabei werden in den neu synthetisierten Strang 
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markierte NTs eingebaut. Diese NTs sind so modifiziert, dass die Polymerase pro 
Zyklus nur ein einziges markiertes NT* in die wachsende Kette einbauen kann. 
Diese Modifikation der NTs ist reversibel, so dass nach der Entfernung dieser 
Modifikation eine weitere Synthese stattfinden kann. Die Sequenzierungsreaktion 
5 verlauft in mehreren Zyklen. Ein Zyklus umfasst im wesentlichen folgende Schritte 
(zyklische Schritte): 

a) Zugabe einer Losung mit markierten Nukleotiden (NT*s) und 
Polymerase zu immobilisierten Nukleinsaureketten, 

10 b) Inkubation der immobilisierten Nukleinsaureketten mit dieser LosUng 

unter 

Bedingungen, die zur Verlangerung der komplementaren Strange urn 
ein NT geeignet sind, 
c) Waschen, 

15 d) Detektion der Signale von einzelnen eingebauten NT*s f 

e) Entfernung der Fluoreszenz-Markierung und der zur Termination 
fuhrenden Gruppe von den eingebauten Nukleotiden 

f) Waschen. 



20 3) Aus der Reihenfolge der detektierten Signale der eingebauten NT*s wird fur 
jede immobilisierte, und an der Reaktion beteiligte NSK bzw. NSKF die spezifische 
Sequenz ermittelt. 

Ein Beispiel fdr den allgemeinen Ablauf der Sequenzierungsreaktion ist in Fig. 2 
25 dargestellt 



Die im Verfahren verwendbaren NT*s sind reversibel mit einem Farbstoff markiert. 
Die Auswahlkriterien fQr diese Farbstoffe sind im Beispiel (Farbstoff) angegeben. 
Dieser Farbstoff ist an das Nukleotid gekoppelt und kann durch eine chemische 
30 oder photochemische Reaktion abgespalten werden. Beispielsweise werden die in 
den Anmeldungen Tcherkassov et ai. ( n Verfahren zur Bestimmung der 
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Genexpression" DPuMA-Aktenzeichen 101 20 798.0-41, „Verfahren zur Analyse 
von Nukleinsaureketten" DPuMA-Aktenzeichen 101 20 797.2-41, „Verfahren zur 
Analyse von NukleinsSurekettensequenzen und der Genexpression" DPuMA- 
Aktenzeichen 101 42 256.3) genannten NT*s eingesetzt. Die genauen Angaben 
5 zum Verfahren, zur Synthese und Anwendung von NTs, einschlielilich 
Polymerasewahl, Reaktionsbedingungen fOr den NT*-Einbau und Abspaltung sind 
den oben genannten Quellen dargestellt. 

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so gewahlt, 
10 daB die Polymerasen an mehr afs 50% der an der Sequenzierungsreaktion 
beteiligten NSKs bzw. NSKFs in einem Zyklus ein markiertes NT* einbauen 
konnen, vorzugsweise an mehr als 90%. 

Die Anzahl der durchzufuhrenden Zyklen hSngt dabei von der jeweiligen 
15 Aufgabenstellung ab, ist theoretisch nicht beschrankt und liegt vorzugsweise 
zwischen 20 und 5000, 

Ein weiterer Gegenstand dieser Erfindung ist eine Reaktionsplattform zur 
DurchfOhrung von chemischen und biochemischen Reaktionen mit einzelnen 
20 MolekOlen, insbesondere zur DurchfOhrung von sequentiellen Reaktionen mit 
einzelnen auf der Oberflache immobilisierten Nukleinsaureketten. Diese 
Reaktionsplattform ist vorzugsweise ein Bestandteil des erfindungsgemaBen 
Sequenzierautomaten. 

25 Die Anwendung des Sequenzierautomaten wird an zwei Ausfuhrungsformen 

■ 

verdeutlicht. 

In einer Ausfuhrungsform wird der Sequenzierautomat for die Sequenzierung von 
langen (Qber 100 kb) Nukleinsaureketten eingesetzt. 

30 
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Dabei wind aus einer langen Nukleinsaurekette (NSK) eine Population aus relativ 
kleinen, Oberiappenden, einzelstrangigen Nukleinsaurekettenfragmenten (NSKFs) 
erzeugt, diese Fragmente mit einem fur den Start der Sequenzierungsreaktion 
geeigneten Primer versehen, in der Reaktionsplattform fixiert und sequenziert. 
Aus den uberlappenden NSKF-Sequenzen kann die ursprilngliche NSK-Sequenz 
rekonstruiert werden ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. 
Adams et al. Academic Press , Huang et al. Genom Res. 1999 v.9 S.868, Huang 
Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 v.23 S.4992, Miller et al. 
J.ComputBiol. 1994 v.1 S.257). Dabei sucht man in der gesamten Population von 
NSKF-Sequenzen nach Obereinstimmungen/Oberlappungen in den Sequenzen von 
NSKFs. Durch diese Obereinstimmungen/Oberlappungen kann man die NSKFs 
miteinander kombinieren und daraus eine grolJere zusammenhangende Sequenz 
rekonstruieren z.B.: 



15 C GTC C GTATG ATG G TC ATTC C ATG 

CAIICCATGGTACGTTAGCICCTAG 

TCCTAGTAAAATCGTACC. 

In der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen 
20 bewahrt, eine Unge der sequenzierten Sttlcke von mehr als 300 bp zu erreichen. 
Das erlaubt die Sequenzierung von Genomen aus Eukaryonten im Schrotschuss- 
Verfahren. 

In einer anderen AusfOhrungsform wird der Sequenzierautomat fQr die 
25 Genexpressionsanalyse eingesetzt. Diese Methode basiert auf mehreren Prinzipien: 

1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genQgend Informationen zur 
Identifizierung des korrespondierenden Gens, wenn die Gensequenz selbst bereits 
in einer Datenbank enthalten ist. 
30 Eine Sequenz aus beispielsweise 10 NTs kann mehr als 10 6 verschiedene 
Kombinationen bilden. Das ist z.B. fur die meisten Gene im menschlichen Genom, 
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das nach heutiger Schatzung 32000 Gene enthalt, ausreichend. FOr Organismen 
mit weniger Genen kann die Sequenz noch kOrzer sein. 

2. Der Methode liegt die Sequenzierung einzelner NukleinsaurekettenmolekOle 
5 zugrunde. 

3. Es konnen Nukleinsaureketten-Gemische untersucht werden. 

4. Die Sequenzierungsreaktion lauft an vielen MolekOlen gleichzeitig ab, wobei die 
10 Sequenz jeder einzelnen immobilisierten Nukleinsaurekette analysiert wird. 

Es ist bekannt, dass zur Untersuchung der Genexpression mRNAs oder von der 
mRNA abgeleitete Nukleinsaureketten (z.B. einzelstrangige cDNAs, 
doppelstrangige cDNAs, von cDNA abgeleitete RNA oder von cDNA amplifizierte 
15 DNA) eingesetzt werden konnen. Unabhangig von der genauen Zusammensetzung 
werden sie im folgenden als Genprodukte bezeichnet Auch Teilsequenzen dieser 
Genprodukte werden im folgenden als Genprodukte bezeichnet. 
Diese Genprodukte stellen ein Gemisch aus verschiedenen Nukleinsaureketten dar. 

20 Die Genprodukte werden in die einzelstrangige Form QberfQhrt, mit einem Primer 
versehen, auf der Reaktionsoberflache fixiert und sequenziert. 

Die ermittelten Sequenzen der immobilisierten Genprodukte werden zur 
Bestimmung der Abundanzen untereinander verglichen und durch Vergleich mit 
25 Gensequenzen in Datenbanken bestimmten Genen zugeordnet. 



30 
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3a. detaillferte Beschreibung bevorzugter AusfQhrungsformen des 
Sequenzierautomaten: 

Apparatur fur Detektion 

5 Zur Detektion der Fluoreszenz von einzelnen MolekQIen werden z.B. Nahfeld- 
Mikroskopie (NFM), Laser-Scanning-Mikroskopie, Totale-lnterne-Reflexions- 
Mikroskopie (TIRM) und Epifluoreszenz-Mikroskopie verwendet Diese Techniken 
unterscheiden sich durch ihre physikalischen Prinzipien und die Bauart ihrer 
optischen Systeme (Science 1999 v.283 1667, Unger et al. BioTechniques 1999 

10 v.27 S.1008, Ishijaima et al. Cell 1998 v.92 S.161, Dickson et al. Science 1996 
v.274 S.966, Xie et al. Science 1994 v.265 S.361, Nie et al. Science 1994 v.266 
S.1018, Betzig et al. Science 1993 v.262 S.1422). Der erfindungsgema&e 
Sequenzierautomat verwendet den Epifluoreszenzmodus als Mikroskopieprinzip. 
Dieser Modus wird vorzugsweise verwendet, weil er sich von TIRM, Laser-Scanning 

15 Microskopie und NFM durch mehrere Vorteile unterscheidet, z.B.: 

1) die Gr6Be des 2D-Bildes, das z.B. durch eine CCD-Kamera-Aufnahme entsteht 
und Qber 1000 Signale von einzelnen MolekQIen enthalten kann (z.B. kann man 
mit einem 100x Objektiv NA 1.4 ein Bild von Ober 100pm x 100 pm anfertigen) 

2) Anregungs- und Fluoreszenzlicht werden durch dasselbe optische System zum 
20 Untersuchungsobjekt geleitet. Dadurch wird nur die Objekt-Flache belichtet, die zur 

Bildentstehung beitragt, die benachbarten Regionen werden nicht belichtet. 

3) Ein solches System ist kostengOnstig im Vergleich zu einem Laser-Scanning- 
System 

25 Das Gehause, die Translationsvoriichtung (Scantisch), das optische System mit 
VergroBerungsvorrichtung (Objektiv), Filtersatzen, dichroischem Spiegel 
(Farbteiler), Lichtquelle und anderen Hilfsvorrichtungen, wie LichtquellenkQhler, 
Lichtreflektor, Blenden usw. sind als „Stand der Technik" Weitfeld- 
Epifluoreszenzmikroskop kommerziell erhaltlich (Firmen: Zeiss, Nikon, Olympus). 

30 Der schematische Aufbau eines „Stand der Technik" Epifluoreszenzmikroskop ist in 
Fig. 3 dargestellt Ein solches Mikroskop kann in den Sequenzierautomaten 
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integriert werden. Beispiele sind folgende Mikroskope: Axioskop (Zeiss), Axioplan 2 
(Zeiss), Axiovert 100TV, 135TV, 200 (Zeiss), Olympus IX 70 (Olympus), Olympus 
BX 61 (Olympus), Eclipse TE 300 (Nikon), Eclipse E800 (Nikon). Die genannten 
Mikroskope dienen fQr den Fachmann als Beispiele einzelner Bestandteile ftlr den 
5 Sequenzierautomaten. Im erfindungsgemaBen Sequenzierautomaten k6nnen auch 
andere gleichwertige funktionelle Einheiten verwendet werden. 
Im folgenden werden beispielhaft die wesentlichen Teile der Ausstattung 
beschrieben. 

10 Es kann ein aufrechtes oder ein invertiertes Mikroskop eingesetzt werden. Zur 
Vereinfachung der Darstellung und nicht zur Einschrankung wird im folgenden ein 
aufrechtes Mikroskop dargestellt (In beiden Fallen wird bevorzugt eine 
Epifluoreszenzbeleuchtung verwendet; im wesentlichen heiSt es, dass das 
Anregungslicht und das Fluoreszenzlicht durch dasselbe optische System des 

15 Objektivs geleitet werden) 

Es konnen unterschiedliche Lichtquellen verwendet werden. Dabei kann die 
Lichtquelle in den Sequenzierautomaten integriert sein oder an ihn Ober einen 
Lichtleiter gekoppelt werden. 

20 Es k6nnen Lichtquellen mit kontinuierlichem oder linienfermigem Spektrum 
verwendet werden. Die spektrale Eigenschaften der Lichtquelle mOssen den 
Anforderungen der Fluoreszenzanregung der Fluoreszenzfarbstoffe entsprechen, s. 
Beispiel Farbstoffe. Sowohl sichtbares als auch infrarotes Licht kann zur Anregung 
verwendet werden, wobei eine Lichtquelle sowohl fQr einen als auch fOr mehrere 

25 Farbstoffe verwendet werden kann. 

Die Intensitat des Anregungslichts bei definierter Wellenlange liegt zwischen 10 
W/cm 2 und 1000.000 W/cm 2 , vorzugsweise zwischen 100 W/cm 2 und 100.000 
W/cm 2 auf der beleuchteten Reaktionsoberflache (10.000 W/cm 2 = 10mW / 100 
pm 2 ). 
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A!s Lichtquelle dient in einer bevorzugten Ausfuhrungsform eine Lampe. Es kOnnen 
beispielsweise Xe, Hg f Hg/Xe Oder „metal halide" Bogenlampen verwendet werden, 
z.B. Quecksilberdamp-kurzbogenflampe HBO 50, HBO 100 oder HBO 200. Der 
Einsatz einer Lampe ist einem Laser vorzuziehen, weil: 
5 1) das Objektfeld, von dem das 2D-Bild (z.B.IOOpm x 100pm) fcemacht wird, 
nahezu gleichmSBig ausgeleuchtet wird, 

2) Licht mit verschiedenen Welleniangen erzeugt wird, so dass eine Lampe zur 
Anregung der Fluoreszenz von mehreren Farbstoffen eingesetzt werden kann. 

3) Lampen im Vergleich zu Lasern kostengQnstiger UV-Licht erzeugen k6nnen. 

10 

In einer anderen bevorzugten Ausfuhrungsform werden ein oder mehrere Laser 
verwendet (z.B. ein Nd:YAG-Laser, Antares, Coherent, mit doppelten Frequenz, 
532nm, zur Anregung von Cy3-Farbstoff und ein Nd:YAG pumped dye Laser, 
Coherent 700, zur Anregung bei 630nm fdr Cy5-FarbstofT). Der Vorteil eines Laser 
15 besteht in seiner langeren Lebensdauer und einer groSen Intensitat des 
Anregungslichtes. 

Auch Laser-Dioden konnen als Lichtquelle verwendet werden. 

Die Belichtungszeit liegt vorzugsweise zwischen 0.1 millisekunden (ms) und 20 
20 sekunden (s), noch besser zwischen 1 ms und 1s. Sie wird beispielsweise durch 
einen akustooptischen oder elektrooptischen Modulator oder durch einen Shutter" 
gesteuert, dervom Hauptcomputer kontrolliert wird. Der Shutter kann beispielsweise 
ein mechanischer Schieber sein. 

25 Zur Selektion von Anregungs- und Fluoreszenzlicht und zur Reduktion des 
Streulichts werden vorzugsweise Filter eingesetzt. Sie sind beispielsweise 
kommerziell erhaltlich (Zeiss, Nikon, Olympus, Leica) und sind an die 
entsprechenden fur die Sequenzierungsreaktion verwendeten Farbstoffe 
anzupassen. Oblicherweise werden mehrere Filter zu einem Filtersatz 

30 zusammengesetzt. Ein solcher Filtersatz besteht Oblicherweise aus einem Filter zur 
Selektion des Anregungslichtes, einem Farbteiler (dichroischem Spiegel) und einem 
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"""—n**-. Kc^nnerzieH slnd sowoh , Mono ^ and . 

fITh T" ( * elnen Farbs,off ' * B - «*' oder cy5 > * — «•«■* 
**o mb ,„ atlon ( „ r mehrere Farbsfoffe iB cyMy5 . Kom erh 

(z.B. bei Firmen Zeiss, Nikon, Leica, Olympus) 

5 

Die Filter sind vorzugsweise in einer Halterung befestigt Diese Helterung ermoglioht 
einen Austausch zwiscben einzelnen Fibern bzw. Flltersatzen. Sowobl ein 

A rT,' "* * F " ,ere0hieber * d * Stad der Tech * W-n* Der 
Austeusch der FlllersaUe ertolg, z.B. automabscb durob einen mi, einem Motor 

10 angetnebenen Filterrevolver. gesteuert von dem Hauptoomputer. 

Das Anregungs- und Fluoreszenzlicb, wird durch ein Objektlv geleite,. Es werden 
vorzugsweise PianNeCuar- und PlanApoc*roma,-Objek,,ve, vorzugsweise 
Ol,mmers,onsob J eldive, mil einer 40 bfe 100 faehen VergrbSerung und mi, einer NA 
15 von vorzugsweise ober 1.2 verwendet. z.B. PlanNeotluar 100x. NA 1.4 (Zeiss) 
PlanApocbroma, 100x NA 1.4 (Zeiss), P,anApo100x NA 1.4 Olympus Japan 
Vorzugsweise wird Immersionsb! mi, niedriger Eigemluoreszenz verwendet z B ' 
Carg le Laboratories, Cedar Grove, NJ. USA. Glycerin oder Wasser konnen aucb 

als Immersionsmedlum mil entsprechenden Immersionsobjektiven verwendet 
werden. 

Das Fluoreszenzlioh, der eingebauten Nukleotide wird mil einem Objekbv (O) 
gesammel, und zur DeteMonsvorricbtung (D) welfe^eleKet Dieae 
Detekbonsvorrichtung stelft vorzugsweise eine gekQMte CCD-Kamera oder 

5ZTZ t ** mm (K> dar - Vartenten von *™ "-»»— 

erba«l,ch z.B. SenSysTM (von Photomebix), AxioCam (von Zeiss) oder 
PentaMAX (von Roper Scientific, Trenton, NJ, USA). 

Es werden bevorzug, COM*, mi, einer boben Auttosung ver^ende,. Dies 
ermoglrch, einerseire die Signale von einzelnen Molekolen beaser zu Identifiziaren 
bzw. nahe beieinandar Itegende Signale besaer zu dWerenzieren (s. Beiapiei 
Datekbon), anderereeus wind bal jeder Aumabme ein Bild von einer groSen Objekt- 
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Fiache und son* eine groSe Anzahl an Signalen bei genQgender Spezifitat der 
Signaleerkennung gleichzeitig aufgenommen. 

Moderne Kameras ermOglichen solche Bildaufnahmen und haben CCD-Chips mit 
e.ner AuflSsung vorzugsweise von mindestens 512x512 Pixel, idealerweise mehr 
5 als 1 000x1 300 Pixel und einer PixelgrSBe von ca. 5pm x 5um. 

Es kann sowohl eine Schwarz-WeiB-Kamera (SW-Kamera) als auch eine 
Farbkamera verwendet werden. Fur die SW-Kamera wird F.uoreszenzlicht von 
gle,ohen Farbstoffen mit einer Mono-Band-Filterkombination selektiert. Bei einer 
10 Farbkamera konnen Multi-Band-Filte*ombinationen eingesetzt werden. 

Mit der Kamera wird ein 2D-Bild angefertigt, das SignalintensitSten als Funktion von 
x,y-Koordinaten wiedergibt. Dieses Bild wird von einem Bildverarbeitungsprogramm 
analysiert, das sowohl die Signale von eingebauten NT's vom Hintergrundsignal 
15 unterscheiden, als auoh nah aneinander liegende Signale differenzieren kann Ein 
Be,sp,el for das Funktionsprinzip eines solchen Programms ist im Beispiel 
„Detektion" beschrieben. 



Vorzugsweise dient als Trans.ationsvorrichtung ein gesteuerter Scantisoh. Solohe 
20 T-sche sind kommerziel. erhaKlich (Marzhauser Wetzlar, Zeiss, Leica, Olympus und 
N.kon). Die Steuerung wird von einem Motor durchgefOhrt, der durch den 
Hauptcomputer kontrol.iert wird. Diese Tische mOssen praise Ober mehrere Zyklen 
d.eselben X-Y-Z-Koordinaten einstellen k6nnen. Vorzugsweise liegt die Abweichung 
von einer definierten Posrtion (x-y-z)i unter 5 M m wahrend der gesamten 
25 Sequenzierungsreaktion, idealerweise unter 0.1pm. 

Der Haupt-Computer (C ) ist mit der Detektionsappatur und mit der 
Reakhonsplattform verbunden und steuert den Ablauf der Sequenzierungsreaktion 
Erne meglichst umfassende Automatisierung der Funktionen des 
» Sequenzierautomaten ist angestrebt Dabei werden vorzugsweise folgende AblSufe 
bzw. Telle im Sequenzierautomaten automatisiert: 
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1 ) alle Vorgange beim LOsungsaustausch an der Reaktionsoberfiache 

2) alle Vorgange bei der Detektion 

3) alle Signalverabeitungsschritte bis zu Sequenzzusammensetzung 

In einer AusfQhrungsform hat der Hauptcomputer auch Zugang zu genetischen 
5 Datenbanken und kann Sequenzzusammensetzung bzw. Sequenzerkennung 
durchfQhren. 

In Fig. 4a und Fig. 4b sind beispielhafte AusfOhrungsformen der Detektionsapparatur 
des erfindungsgemaBen Sequenzierautomaten dargestellt, wobei als Lichtquelle eine 
10 Lampe dient. 

In Fig. 5 ist eine beispielhafte Anordnung einer Detektionsapparatur mit 2 Lasem 
dargestellt. 

Reaktionsplattform 

15 Die Reaktionsplattform stellt vorzugsweise eine gesteuerte Durchflussvorrichtung 
dar. Sie besitzt eine oder mehrere Reaktionsoberfiachen und erlaubt einen 
kontrollierten sequentiellen Austausch von Reaktionslosungen, so dass eine 
DurchfQhrung von sequenziellen Reaktionen an diesen Oberfiachen mQglich ist Im 
folgenden soli beispielhaft eine AusfQhrungsform einer solchen Reaktionsplattform 

20 dargestellt werden (Fig. 6a). 

Es konnen eine oder mehrere Reaktionsplattformen gleichzeitig verwendet werden. 
Eine parallele Anordnung von zwei Reaktionsplattformen erlaubt das Scannen der 
Reaktionsplattform (1) wahrend in der Reaktionsplattform (2) die biochemischen 
25 Reaktionen ablaufen. Die Reaktionsplattformen sind am Scantisch befestigt und 
werden durch diesen bewegt. 

In einer bevorzugten AusfQhrungsform besteht die Reaktionsplattform aus 3 Teilen 
(Fig. 6a): 
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1) dem austauschbaren Teil, einem Chip (204a) mit einem MikroflQssigkeitskanal ( 
204b)., MFK, der die ReaktionsoberflSche trSgt und vorzugsweise fdr nur eine 
Sequenzierunganalyse verwendet wird; 

2) einem stationaren Teil, der Verteilungsvorrichtung (Verteiler) (Fig. 6c), die den 

5 Losungsaustausch im MFK steuert; dabei ist der MFK mit dem Verteiler derart 

verbunden, dass Losungen in den MFK automatisch zugefuhrt und entfernt 
werden konnen, 

3) einem weiteren stationaren Teil der Reaktionsplattform, einer Thermostateinheit 
(Fig. 6c, 220), mit der die Temperatur im MFK geregelt werden kann 

10 (Thermoblock). 

Ein Beispiel fur den Aufbau eines Chips mit dem MFK ist schematisch in Fig. 6b 
dargestellt. Er besteht aus 2 Platten (222, 223) und 2 Abstandhaltem, so dass ein 
Kanal (204b) zwischen beiden Platten entsteht Die Hohe dieses Kanals liegt 

15 vorzugsweise zwischen 5 und 200 pm, die Breite zwischen 0.1 und 10 mm und die 
LSnge zwischen 10 und 40 mm. Die dem Objektiv zugewandte Abdeckplatte des 
MFK besitzt eine fQr das Anregungs- und Fluoreszenzlicht durchlassige Oberflache 
bzw. ein Fenster, vorzugsweise aus Glas. Der Chip selbst kann z.B. aus Glas oder 
Kunststoff (z.B. PMMA, PVC, Polycarbonate) aufgebaut werden. 

20 In einer anderen AusfOhrungsform besitzt ein Chip mehrere MFKs (z.B. 2 oder 3 
oder 4), wobei der Losungsaustausch in diesen MFKs unabhangig voneinander 
gesteuert durch den Verteiler erfolgen kann. Auf diese Weise konnen 
unterschiedliche Zyklusschritte parallel in einem Chip ablaufen, so dass die 
Analysezeit verkOrzt wird. 

25 Im folgenden wird als Beispiel ein Chip mit nur einem MFK betrachtet. 

Der Austausch von FlOssigkeiten im MFK wird durch den Verteiler (Fig. 6a,c,d f ef) 
gesteuert. Er besteht in einer AusfOhrungsform aus einem Bauelement mit 
integrierten gesteuerten Ventilen, ZufOhrungsschleuchen und einer oder mehreren 
30 Pumpen. Ihre Zahl und genaue Anordnung ist der jeweiligen AusfOhrungsform 
anzupassen. Die FlOsigkeitsbeforderung im System erfolgt durch eine oder mehrere 
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an den Verteiler angeechlosaenen durch den Computer gesteuerten Pempen. Der 
, ISt mit d8n Vo^haltem der ReakSonslosungen verbunden. Die Ventlle 
rcguteren die Zufuhr der ReaMonslasungen. Die Steuen.no der Ventile Kann 
be, 8 p,e, SW e,se ml, Motoren. hydraufech Oder eieWronte* ertblgen und WW duroh 
5 den Hauptcomputer kontrolliert. 

Je nach AusfQhrungsform (s. Beispiel Farbstoff, Farbkodierung) werden entweder 
v-er NT's bzw. zwei NT's gleichzeitig oder nur ein NT* in die Einbaureakfion 
zugegeben. Beispielhafte AusfQhrungsformen sind in Fig. 6d und Fio 6e 
10 angegeben. a ' 

In einer Ausfuhrungsforrn (Fig, 60 ist ein optischer Detektor zur Kotrolle des 
Losungsaustausches integriert. Dieser Detektor ist in den Regeikreis der 
Reakhonspiattform eingeschaltet und kann beispielsweise durch die Detektion der 
15 Veranderungen der durchfieBenden L6sung (z.B. optische Dichte, Lichtabsorbtion 
oder Fluoreszenz) den LSsungsaustausch kontrollieren. 

Bei Bedarf kannen weitere Modifikationen des Verteilers (zusatzliche 
ZufGhrungsschlauche, Pumpeh, Ventiie usw.) vorgenommen werden, damit auch 
20 andere begieitende Schritte der NSK-Sequenzierung automatisch ablaufen konnen 



Reaktionsoberflache 



25 



D,e Reaktionsoberflache befindet sich vorzugsweise auf der Unterseite der dem 
Objektiv zugewandten Abdeckplatte des MFK. Die Reaktionsoberflache ist plan so 
dass S.gnale von vielen einzelnen, auf dieser Oberflache fixierten MolekQIen in der 
Tiefenscharfe (Fokusebene) des verwehdeten Objektivs liegen. Die Anzahl der 
SIgnale, die von einem Objektfeld gleichzeitig detektiert werten liegt vorzugsweise 
Qber 100, noch bevorzugter Qber 1000. 
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Die Reaktionsoberflache besteht in einer AusfQhrungsform aus einer festen Phase, 
z.B. Glas Oder Kunsstoff (z.B. PMMA) oder Silicon-Derivaten, die fOr das 
Anregungs- und Fluoreszenzlicht durchiassig ist In einer anderen bevorzugten 
AusfQhrungsform ist die Reaktionsoberflache die Oberflache eines Gels, z.B. eines 
5 Poiyacrylamidgels. Das Gel liegt auf einer festen Unterlage, z.B. Glas oder 
Kunststoff, die fQr das Anregungs- und Fluoreszenzlicht durchiassig ist. 

An diese Oberflache sind die zu sequenzierenden NSKs in Form von NSK-Primer- 
Komplexen oder NSKF-Primer-Komplexen fixiert, s. Beispiel (Immobilisation). Die 

10 Immobilisierungsdichte der NSK-Primer-Komplexe oder NSKF-Primer-Komplexe 
erlaubt Identifizierung eines einzelnen markierten eingebauten NT-MolekGIs auf der 
Oberflache. Bevorzugt werden NSK-Primer-Komplexe bzw. NSKF-Primer-Komplexe 
in einer Dichte immobilisiert, die eine Detektion von mindestens 10 bis 100 Signale 
pro 100 pm 2 von einzelnen eingebauten NTs zulasst bzw. mindestens 50%, 

15 idealerweise 90% der identifizierter Fluoreszenzsignale von einzelnen 
FarbstoffmoIekQIen stammen, die an die in NSKs eingebauten NTs gebundenen 
sind. 

Die Reaktionsoberflache tragt vorzugsweise ein fur die Justierung der Bilder 
20 geeignetes Muster. Dieses Muster besteht beispielsweise aus Mikroteilchen mit 
einem Durchmesser von weniger als 1 pm, die an der Reaktionsoberflache fixiert 
sind. Ein Beispiel eines solchen Musters sind auf der Oberflache fixierte Tusche- 
Teilchen mit einem Durchmesser von weniger als 1 pm. Die Dichte der Verteilung 
dieser Teilchen betrSgt vorzugsweise weniger oder gleich 1 Teilchen pro 100 ^m 2 . 
25 Diese Teilchen dienen erstens zur Einstellung der Fokusebene und zweitens zur 
Justierung von Bildem (Fluoreszenzbildern) aus verschiedenen Zyklen der 
Sequenzierungsreaktion (s. Beispiel Detektion). 

In einer Ausftihrungsform konnen Mikroteilchen Licht absorbieren und werden im 
30 Transmissionslicht sichtbar gemacht. In einer anderen AusfQhrungsform konnen 
Mikroteilchen fluoreszieren und werden beispielsweise im Epifluoreszenzmodus 



WO 03/031947 



PCT/EP02/11098 



-19- 



sichtbar gemacht. UnabhSngig von der AusfQhrungsform dQrfen diese Teilchen die 
Reaktion und die Detektion der Fluoreszenzsignale von einzelnen eingebauten 
NT*s nicht storen. 

5 3b. Ablauf einzelner Schritte im Sequenzierautomaten 

Die Analyse der Sequenzen beinhaltet folgende wesentliche Schritte: 

a) Probenvorbereitung 

b) Immobilisierung von NSKs bzw. NSKFs 

c) Zyklische Schritte 
10 d) Signalanalyse 

Die Probenvorbereitung erfolgt auBerhalb des Sequenzierautomaten und ist im 
Beispiel Probenvorbereitung beschrieben. Die fur die Sequenzierungsreaktion 
vorbereitete NSKs oder NSKFs sind vorzugsweise zwischen 50 und 5000 NT lang 
15 und enthalten eine PBS. 

Die Schritte b, c und d werden vom Sequenzierautomaten durchgefOhrt 

Immobilisierung von NSKs bzw. NSKFs: 

Ziel dabei ist die NSKs bzw. NSKFs in Form von NSK-Primer-Komplexen bzw. 
20 NSKF-Primer-Komplexen auf der Oberflache zu binden. Dies kann mit 
verschiedenen Verfahren erfolgen. Einige Beispiele fQr Fixierung von Komplexen 
sind im Beispiel (Immobilisierung) angegeben. . 

Zyklische Schritte: 

25 Die Abfolge der zyklischen Schritte kann sich je nach AusfQhrungsfonn 
unterscheiden. Grundsatzlich werden folgende Schritte in einem Zyklus 
durchgefOhrt: 

a) Zugabe einer Reaktionslosung mit markierten Nukleotiden (NT*s) 
und Polymerase zu den immobilisierten Nukleinsaureketten, 
30 b) Inkubation der immobilisierten Nukleinsaureketten mit dieser 

L6sung unter Bedingungen, die zur VeriSngeiung der 
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komplementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen modifizierten, in 

♦ 

die neusynthetisierten Strange eingebauten NT*-MolekOlen, 
5 e) Entfernung der Markierung und der zur Termiantion fdhrenden Gruppe 

von den eingebauten Nukleotiden, 
f) Waschen 

Zur Vermeidung von unspezifischen Bindung einzelner Komponenten des 
10 Reaktionsgemisches kann eine oder mehrere Blockierungsldsungen auf die 
Oberflache gebracht werden. 

Signalanalyse: 

die relative Position einzelner NSKs bzw. NSKFs auf der Reaktionsoberflache und 
15 die Sequenz dieser NSKs bzw. NSKFs werden durch spezifische Zuordnung der in 
Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten 
Fluoreszenzsignale bestimmt. Diese Signalanalyse und Sequenzrekonstruktion 
kfinnen parallel zu biochemischen Reaktionen und Detektion oder nach dem 
Abschluss der zyklischen Schritte durchgefuhrt werden. Ein Beispiel fur das 
20 Funktionsprinzip eines Programms fur die Signalanalyse ist im Beispiel Detektion 
angegeben. 

Der Ablauf der zyklischen Schritt wird vom Hauptcomputer kontrolliert. 

25 Unabhangig von dem verwendeten Sequenzierungsverfahren, beispielsweise 
(Tcherkassov et al. CVerfahren zur Bestimmung der Genexpression" DPuMA- 
Aktenzeichen 101 20 798.0-41, .Verfahren zur Analyse von Nukleinsaureketten" 
DPuMA-Aktenzeichen 101 20 797.2-41, .Verfahren zur Analyse von 
Nukleinsaurekettensequenzen und der Genexpression" DPuMA-Aktenzeichen 101 

30 42 256.3), hangt die Wahl der Farbstoffe von dem Filtersystem im 
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Sequenzierautomaten ab. Einige mogliche Varianten von Farbkodierungen sind im 
Beispiel (Farbstoffe) dargestellt. 

In einer AusfGhrungsform konnen die vier NTs mit vier unterschiedlichen, aber 

5 jeweils spezifischen Farbstoffen markiert werden (z.B. Cy2, Cy3, Cy5, Cy7). In 

diesem Fall enthalt die Reaktionslosung alle vier NTs . Sie werden im Schritt (b) 

eingebaut und bilden entsprechend vier verschiedene Signal-Populationenen auf 

der Oberflache. Zur Detektion der Signale ist in dieser Ausfflhrungsform der 

Sequenzierautomat mit Filtersatzen ausgestattet, die Selektion der Anregungs- und 

10 Fluoreszenzlicht von vier NTs ermoglichen. Im folgenden wird beispielsweise eine 

Detektionsvorrichtung eingesetzt, die nur Graustufen-Signal unterscheiden kann, so 

dass die Farbkodierung der NTs durch die definierten Filtersatzkombinationen 
erfolgt. 

15 Die Signaldetektion in jedem Zyklus erfolgt durch das Abscannen der Oberflache. 
Dabei wird die Reaktionsplattform mit der Reaktionsoberflache durch die 
Translationsvorrichtung (Scantisch) in X.Y.Z-Achsen bewegt (X.Y-Achse dient dem 
Positionswechsel, Z-Achse - Einstellung der Fokusebene, s. Beispiel Detektion). 
Das Abscannen erfolgt so, dass mehrere Felder auf der Oberflache in einem Zyklus 

20 nacheinander untersucht werden, wobei pro Feld mehrere Signale von einzelnen 
eingebauten NTs detektiert werden (beispielsweise 5000). Diese Felder stellen 
vorzugsweise nicht-Oberlappende Felder dar (Fig.7). In alien Zyklen werden 
dieselben Felder untersucht. Die Anzahl der Felder, die untersucht werden, hangt 
von der Gesamtzahl der Sequenzen, die analysiert werden mussen, ab und ist je 

25 nach Aufgabestellung unterschiedlich. s. Beispiel Sequenzierung, Genexpresion. 

In einem Zyklus wird jedes Feld mit Anregungslicht fur einen bestimmten Farbstoff, 
selektiv durch den entsprechenden Filtersatz, belichtet. Die Fluoreszenzsignale der 
eingebauten NTs werden mit der Detektionsvorrichtung detektiert, so dass je ein 
30 2D-Bild pro Nukleotidart und Objektfeld entsteht. Da die vier NTs unterschiedliche 
Markierungen tragen, muss jedes Objektfeld in Kombination mit vier Filtersatzen 
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nacheinander belichtet wird, so dass vier 2D-Bilder, jeweils mit einem bestimmten 
Filtersatz, von jedem Objektfeld entstehen. Diese Bilder tragen die Information Qber 
die x,y-Verteilung der Signale von eingebauten NTs. Ein Beispiel eines Programms 
far die Bildauswertung und Signalerkennung ist im Beispiel Detektion beschrieben. 

5 

In einer anderen AusfQhrungsform werden zwei Reaktionsplattformen mit je einem 
MFK, MFK1 und MFK2, parallel betrieben. Das erlaubt die zeitaufwendigen Teile 
eines Zyklus parallel durchzufQhren: WShrend in MFK1 die Schritte e-f vom Zyklus n 
Oder die Schritte a-c vom Zyklus n+1 durchgefOhrt werden, wird im MFK2 der Schritt 
10 d durchgefuhrt, das Abscannen der Reaktionsoberflache. Dann tauschen MFK1 und 
MFK2 ihre Positionen und die Reaktionsoberfiache des MFK1 wird abgescannt, 
wShrend in MFK2 die biochemischen Reaktionen durchgefQhrt werden. 

In einer anderen AusfQhrungsform werden vier NT*s mit nur zwei verschiedenen 
15 Farbstoffen markiert (z.B. Cy3 und Cy5), s. Beispiel (Farbstoffe). Im Zyklus N 
werden dabei jeweils nur zwei unterschiedlich markierte NTs gleichzeitig 
eingesetzt. In dem nachsten Zyklus N+1 werden entsprechend die restlichen zwei 
unterschiedlich markierte NTs eingesetzt. In dieser AusfQhrungsform kann ein 
Sequenzierapparat mit nur zwei unterschiedlichen Farbfiltern eingesetzt werden. 
20 Andere Kombinationen von Farbstoffen, Filtersatzen, sowie Scannen der 
Oberflache und der Prozessteuerung sollten einem Fachmann naheliegend 
erscheinen. 

In einer AusfQhrungsform wird die Reakionsoberflache vor dem ersten Zyklus 
25 abgescannt und jedes potentielle Objektfeld wird in Fokus gebracht, wobei die Z- 
Achsen-Parameter fQr die Fokuseinstellung jedes Objektfeldes von der Software 
gespeichert werden. In folgenden Zyklen werden in jedem Detektionsschritt die 
gespeicherten Z-Achsen-Parameter fOr jedes Objektfeld verwendet. 
In einer anderen AusfQhrungsform erfolgt eine Fokuseinstellung eines jeden 
30 Objektfeldes wahrend des ersten Zyklus, wobei in darauf folgenden Zyklen die 
gespeicherten Z-Achsen-Parameter for jedes Objektfeld verwendet werden. 
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ln einer AusfQhrungsform wird in jedem Zyklus an jedem Objektfeld vor der 
Detektion der Signale von einzelnen MolekQIen eine Kontrolle der Z-Achsen- 
Einstellung der Reaktionsoberflache (s. Beispiel Detektion ) durchgefQhrt. Eine 
5 solche Kontrolle gewahrleistet, dass eingebaute NTs in der Fokusebene des 
Objektivs liegen und scharf abgebildet werden. Diese Kontrolle wird gleich nach der 
Einstellung eines neuen Feldes durchgefQhrt und, falls sich die Oberfiache 
auBerhalb der Fokusebene befindet, wird durch den Z-Antrieb (Beispielsweise des 
Scantisches, eingebaut in den Mikroskopstativ, Oder Piezo-Antrieb des Objektivs), 
10 die Autofokusfunktion der Software aktiviert und die Oberfiache in den Fokus 
gebracht. Diese Kontrolle findet auf jedem Objektfeld einmal vor der Aufnahme der 
Signale von einzelnen MolekQIen statt. Mit dieser kontrollierten Z-Position k6nnen 
alle Bilder an diesem Feld in einem Zyklus gemacht werden. 

15 In einer AusfQhrungsform wird an jedem Feld in ein Justierungsbild zur Kontrolle der 
X.Y-Achse-Einstellung der Reaktionsoberflache gemacht. Ein Justierungsbild kann 
mit einem im Beispiel Detektion beschriebenen Muster gemacht werden. 

Prinzipien der X.Y.Z-Einstellung eines Objektfeldes sind in einer AusfQhrungsform 
20 im Beispiel Detektion dargestellt. 

4. Beispiele 

4.1 Materials uswahl und Materialvorbereitung: 

Beispiel 4.1.1 Materialauswahl und -vorbereitung bei Sequenzierung langer 
25 NSKs 

Vorselektionierte DNA-Sequenzen (z.B. in YAC-, PAC-, oder BAC-Vektoren (R. Anand 
et al. NAR ig89 v.17 S.3425, H. Shizuya et al. PNAS 1992 v.89 S.8794, "Construction 
of bacterial artificial chromosome libraries using the modified PAC system" in "Current 
Protocols in Human genetics" 1996 John Wiley & Sons Inc.) klonierte Abschnitte eines 
30 Genoms) und nicht vorselektionierte DNA (z.B. genomische DNA, cDNA-Gemische) 
kannen analysiert werden. 



WO 03/031947 



PCT/EP02/11098 



-24- 

Durch eine Vorselektion ist es m5glich, im Vorfeld relevante lnformationen, wie z.B. 
Sequenz-Abschnitte aus einem Genom oder Populationen an Genprodukten, aus der 
gro&e Menge genetischer lnformationen herauszufiltern und damit die Menge der zu 
analysierenden Sequenzen einzuschr^nken. 

5 

Bevorzugt werden gewonnene NSKs ohne Amplifikationsschritte weiter verwendet 
(z.B. keine PCR und keine Klonierung). 

Ziel der Materialvorbereitung ist es, gebundene einzelstrangige NSKFs mit einer 
10 Lange von vorzugsweise 50-1000 NTs, einer einzelnen Primerbindungsstelle und 
einem hybridisierten Primer (gebundene NSKF-Primer-Komplexe) zu erhalten. 
Diese Komplexe konnen sher variable Strukturen haben. Zur Verbesserung der 
Anschaulichkeit folgen nun einige Beispieie, wobei die angefQhrten Methoden 
einzeln oder in Kombination eingesetzt werden konnen. 

15 

Erzeugung kurzer Nukleinsaurekettenfragmente (50-1000 NTs) 
(Fragmentierungsschritt); Dieser Schritt wird vorzugsweise auSerhalb des 
Sequenzierautomaten durchgefuhrt: 

Wichtig ist, dass die Fragmentierung der NSKs so erfolgt, dass Fragmente erhalten 
20 werden, die uberlappende Teilsequenzen der Gesamtsequenzen darstellen. Dies wird 
durch Verfahren erreicht, bei denen unterschiedlich lange Fragmente als 
Spaltprodukte in zufallsmSBiger Verteilung entstehen. 

Die Erzeugung der Nukleinsaurekettenfragmente (NSKFs) kann durch mehrere 
25 Methoden erfolgen, z.B. durch die Fragmentierung des Ausgangsmaterials mit 
Ultraschall oder durch Endonukleasen ("Molecular cloning" 1989 J.Sambrook et al. 
Cold Spring Harbor Laborotary Press), wie z.B. durch unspezifische Endonukleasege- 
mische. ErfindungsgemaB wird die Ultraschall-Fragmentierung bevorzugt Man kann 
die Bedingungen so einstellen, dass Fragmente mit einer durchschnittlichen Lange 
30 von 100 bp bis 1 kb entstehen. Diese Fragmente k6nnen anschlieBend an ihren 
Enden durch das Klenow-Fragment (E.coli-Polymerase I) oder durch die T4-DNA- 
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Polymerase aufgefilllt werdenfMolecuiar cloning" 1989 J.Sambrook et al. Cold Spring 
Harbor Laborotary Press). 

Aufterdem konnen aus langen NSKs unter Verwendung randomisierter Primer 
5 komplementare kurze NSKFs synthetisiert werden. Besonders bevorzugt wird diese 
Methode bei der Analyse der Gen-Sequenzen. Dabei werden an der mRNA 
einzelstrSngige DNA-Fragmente mit randomisierten Primem und einer reversen 
Transkriptase gebildet (Zhang-J et al. BiochemJ. 1999 v.337 S.231, Ledbetter et al. 
J.BioLChem. 1994 v.269 S.31544, Kolls et al. Anal.Biochem. 1993 v.208 S.264, 
10 Decraene et al. Biotechniques 1 999 v.27 S.962). 

EinfUhrung einer Primerbindungsstelle in die NSKFs: 

Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt, der eine selektive Bindung 
des Primers an das NSKF ermoglichen soil. 

15 

In einer AusfQhrungsform konnen die Primerbindungsstellen unterschiedlich sein, so 
dass mehrere unterschiedlche Primer verwendet werden mOssen. In diesem Fall 
kOnnen bestimmte Sequenzabschnitte der Gesamtsequez als natQrliche PBSs filr 
spezifische Primer dienen. Diese AusfQhrungsform ist besonders fur die Untersuchung 

20 bereits bekannter SNP-Steiien geeignet. 

In einer anderen AusfQhrungsform ist es aus Grtinden der Vereinfachung der Analyse 
gQnstig, wenn eine einheitliche Primerbindungsstelle in alien NSKFs vortianden ist. 
GemaB einer bevorzugten AusfQhnjngsform der Erfindung werden die 
Primerbindungsstellen daher in die NSKFs extra eingefQhrt Auf diese Weise kOnnen 

25 Primer mit einheitlicher Struktur ftir die Reaktion eingesetzt werden. 

Im folgenden wird diese AusfOhrungsform detailliert beschrieben. 
Die Zusammensetzung der Primerbindungsstelle ist nicht eingeschr^nkt Ihre L§nge 
betrSgt vorzugsweise zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine 
30 funktionelle Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe 
kann z.B. eine Biotingruppe sein. 
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Als Beispiel fQr die EinfQhrung einer einheitlichen Primerbindungsstelle werden im 
folgenden die Ligation und das Nukleotid-Tailing an DNA-Fragmente beschrieben. 

5 a) Ligation: 

Dabei wird ein doppelstrangiger Oligonukleotidkomplex mit einer Primerbindungsstelle 
verwendet. Dieser wird mit kommerziell erhaltlichen Ligasen an die DNA-Fragmente 
ligiert ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary 
Press). Es ist wichtig, dass nur eine einzige Primerbindungsstelle an das DNA- 

10 Fragment ligiert wird. Das erreicht man z.B. durch eine Modifikation einer Seite des 
Oligonukleotidkomplexes an beiden Str§ngen. Die modrfizierenden Gruppen am 
Oligonukleotidkompex konnen zur Immobilisation dienen. Die Synthese und die 
Modifikation eines solchen Oligonukleotidkomplexes kann nach standardisierten 
Vorschriften durchgefuhrt werden. Zur Synthese kann z.B. der DNA-Synthesizer 380 A 

15 Applied Biosystems verwendet werden. Oligonucleotide mit einer bestimmten 
Zusammensetzung mit oder ohne Modifikationen sind aber auch als Auftragssynthese 
kommerziell erhaltlich, z.B. von MWG-Biotech GmbH, Germany. 

b) Nukleotid-Tailing: 

20 Statl der Ligation mit einem Oligonukleotid kann man mit einer terminalen 
Deoxynucleotidyltransferase mehrere (z.B. zwischen 10 und 20) Nukleosid- 
monophosphate an das 3'-Ende eines ss-DNA-Fragments anknQpfen ("Molecular 
cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in 
Enzymology" 1999 v.303, S.37-38), z.B. mehrere Guanosin-Monophosphate ((G)n- 

25 Tailing genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem 
Beispiel eines (C)n-Primers, verwendet 

Einzelstrang-Vorbereitung: 

FQr die Sequenzierungsreaktion werden einzelstrSngige NSKFs benetigt Falls das 
30 Ausgangsmaterial in doppelstrangiger Form vorliegt, gibt es mehrere Moglichkeiten, 
aus doppelstrangiger DNA eine einzelstrSngige Form zu erzeugen (z.B. Hitze- 
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Denaturlerung oder Alkali-Denaturierung) C'Molecular cloning" 1989 J.Sambrook et al. 
Cold Spring Harbor Laborotary Press). 

Beispiel 4.1.2 Materialauswahl und -vorbereitung bei der 
5 Genexpressionsanalyse: 

Genprodukle k6nnen von verschiedenen biologischen Objekten stammen, so z.B. von 
einzelnen Zellen, Zellpopulationen, einem Gewebe oder von kompletten Organismen. 
Auch biologische FlOssigkeiten wie Blut, Sputum oder Liquor konnen als Quelle der 
Genprodukte dienen. Die Methoden zur Gewinnung der Genprodukte aus den 
10 verschiedenen biologischen Objekten sind bespielsweise folgenden Literaturquellen 
zu entnehmen: "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor 
Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 
I.G. Cowell, Humana Press Inc.. 

15 Es kann sowohl die Gesamtheit der isolierten Genprodukte als auch ein durch eine 
Vorselektion ausgewahlter Teil davon in die Sequenzierungsreaktion eingesetzt 
werden. Durch Vorselektion kann man die Menge der zu analysierenden Genprodukte 
reduzieren. Die Vorselektion kann beispielsweise durch molekularoiologische 
Verfahren wie z.B. PCR-Amplifikation, Gel-Auftrennung oder Hybrid isierung mit 

20 anderen Nukleinsaureketten erfolgen C'Molecular cloning" 1989, Ed. Maniatis, Cold 
Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library 
protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.) 

Vorzugsweise wind die Gesamtheit der Genprodukte als Ausgangsmaterial gewahlt. 
Bevorzugt werden Genprodukte ohne Amplifikationsschritte weiter verwendet (z.B. 
25 keine PCR und keine Klonierung). 

Ziel der Vorbereitung des Materials ist es, aus dem Ausgangsmaterial an die 
Oberflache gebundene, extensionsfahige Genprodukt-Primer-Komplexe zu bilden. 
Wobei pro Genprodukt maximal nur ein Primer binden solRe. 
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Primerbindungsstelle (PBS): 

Jedes Genprodukt hat vorzugsweise nur eine Primerbindungsstelle. 

Eine Primerbindungsstelle 1st ein Sequenzabschnitt, der eine selektive Bindung des 

Pnmers an das Genprodukt ermOglichen soli. 

5 

Als Primerbindungsstellen kfinnen Abschnitte in der Nukleinsauresequenz dienen die 
m den zu analysierenden Sequenzen natQrlicherweise vorkommen (z B polyA- 
Strecken in mRNA). Eine Primerbindungsstelle kann auch zusatzlich in das 
Genprodukt eingefiihrt werden (Molecular cloning" 1989, Ed. Maniatis, Cold Spring 
10 Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDIMA library protocols" 
1997, Ed. I.G. Cowell, Humana Press Inc.). 

Aus Gronden der Vereinfachung der Analyse kann es wichtig sein, dass eine 
moghchst einheitliche Primerbindungsstelle in alien Genprodukten vomanden ist 
15 Dann kflnnen Primer mit einheitlicher Struktur in die Reaktion eingesetzt werden 
Die Zusammensetzung der Primerbindungsstelle ist nicht eingeschrankt. Ihre Lange 
betragt vorzugsweise zwischen 10 und 100 NTs. Die Primerbindungsstelle kann eine 
funktonelle Gruppe tragen, beispielsweise zur Bindung des Genprodukts an die 

Oberflache. Diese funktionelle Gmppe kann z.B. eine Biotin- oder Digoxigenin-Gruppe 
20 sein. 

Als Beispiel fur die Einftihrung einer Primerbindungsstelle in die Genprodukte wird das 
Nukleotid-Tailing von antisense cDNA-Fragmenten beschrieben. 

25 Als erstes werden einzelstrangige cDNAs von mRNAs synthetisiert. Es resultiert eine 
Population an cDNA-MolekOlen, die eine Kopie der mRNA-Population darstellen 
sogenannte antisense-cDNA. (Molecular cloning" 1989, Ed. Maniatis, Cold Spring 
Harbor Laboratory , "Method in Enzymolog/' 1999, v303, "cDNA library protocols" 
1997, Ed. I.G. Cowell, Humana Press Inc.). Mit einer terminalen 

30 Deoxynucleotidyltransferase kann man mehrere (z.B. zwischen 10 und 20) Nukleosid- 
monophosphate an das 3--Ende dieser antisense cDNA anknOpfen, z.B. mehrere 
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Adenosin-Monophosphate ((dA)n-Tail genannt). Das entstehende Fragment wird zur 
Bindung des Primers, in diesem Beispiel eines (dT)n-Primers, verwendetC'Molecular 
cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in 
Enzymology" 1999 v.303, S.37-38). 

5 

Beispiel 4.1.3 Primer fiir die Sequenzierungsreaktion: 

Dieser hat die Funktion, den Start an einer einzigen Stelle der NSK bzw. NSKF zu 
10 ermoglichen. Er bindet an die Primerbindungsstelle in der NSK (z.B. im Oligonukleotid 
Oder im Genprodukt) Oder im NSKF. Die Zusammensetzung und die Lange des Pri- 
mers sind nicht eingeschrankt AuBer der Startfunktion kann der Primer auch andere 
Funktionen ubemehmen, wie z.B. eine Verbindung zur Reaktionsoberflache zu 
schaffen. Primer sollten so an die Lange und Zusammensetzung der 
15 Primerbindungsstelle angepa&t werden, dass der Primer den Start der 
Sequenzierungsreaktion mit der jeweiligen Polymerase ermoglicht. 

Bei der Verwendung unterschiedlicher, beispielsweise natOrlich in der ursprilnglichen 
Gesamtsequenz vorkommender Primerbindungsstellen, werden die fur die jeweilige 
20 Primerbindungsstelle sequenzspezifischen Primer verwendet. In diesem Fall wird fur 
die Sequenzierung ein Primergemisch eingesetzt. 

Bei einer einheitlichen, beispielsweise durch die Ligation an die NSKFs angekoppelten 
Primerbindungsstelle wird ein einheitlicher Primer verwendet 

25 

Vorzugsweise betragt die LSnge des Primers zwischen 6 und 100 NTs, 
optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine Funktionsgmppe 
tragen, die zur Immobilisierung des NSKF dient, beispielsweise ist eine solche 
Funktionsgruppe eine Biotingruppe (s. Abschnitt Immobilisierung). Sie soli die 
30 Sequenzierung nicht steren. Die Synthese eines solchen Primers kann z.B. mit dem 
DNA-Synthesizer 380 A Applied Biosystems ausgefOhrt werden oder aber als 
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Auftragssynthese bei einem kommerziellen Anbieter, z.B. MWG-Biotech GmbH, 
Germany erstellt werden). 

Der Primer kann vor der Hybridisierung an die zu analysierenden NSKs oder NSKFs 
5 auf der Oberflache mit verschiedenen Techniken fixiert oder direkt auf der Oberflache 
synthetisiert werden, beispielsweise nach (McGall et al. US Patent 5412087, Barrett et 
al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip 
technology" 2000 M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena 
Oxford University Press, Fodor et al. Science 1991 v.285 S.767, Timofeev et al. 
10 Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al. NAR 1987 v.15 S.5353, 
Gingeras et al. NAR 1987 v.15 S.5373, Maskos et al. NAR 1992 v.20 S.1679). 

Die Primer werden auf der Oberflache beispielsweise in einer Dichte zwischen 10 bis 
100 pro 100 urn 2 , 100 bis 10.000 pro 100 urn 2 oder 10.000 bis 1.000.000 pro 100um 2 
15 gebunden. GroBere Fixierungsdichte wird bevorzugt, wobei keine Notwendigkeit der 
optischen Identifizierung eines jeden Primers besteht: grSBere Primer-dichte 
beschleunigt die Hybridisierung von zu analysierenden NSKs oder NSKFs. 

* 

Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi- 
20 sierungsbedingungen inkubiert, die ihn selektiv an die Primerbindungsstelle der NSKs 
oder der NSKFs binden lassen. Diese Primer-Hybridisierung (Annealing) kann vor (1), 
wahrend (2) oder nach (3) der Bindung der NSKs bzw. NSKFs an die Oberflache 
erfolgen. Die Optimierung der Hybridisierungsbedingungen hangt von der genauen 
Struktur der Primerbindungsstelle und des Primers ab und laBt sich nach Rychlik et al. 
25 NAR 1990 v.18 S.6409 berechnen. Im folgenden wereten diese 
Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen 
bezeichnet. 

Falls eine fur alle NSKs bzw. NSKFs gemeinsame Primerbindungsstelle mit bekannter 
30 Struktur beispielsweise durch Ligation eigefOhrt wird, k6nnen Primer mit einheitlicher 
Struktur eingesetzt werden. Die Primerbindungsstelle kann an ihrem 3'-Ende eine 
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funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. Beispielsweise ist diese 
Gruppe eine Biotin-Gruppe. Der Primer hat eine zur Primerbindungsstelle 
komplementare Struktur. 

5 Bindung von Primern an die Oberfiache der MFK erfolgt im Vorfeld zu Experimenten 
und ist vorzugsweise kein Bestandteil des Verfahrens. Chips mit den an der 
Oberfiache der MFK gebundenen Primern kQnnen langere Zeit gelagert werden. 

Beispiel 4.1.4 Immobilisation: 

10 Fixierung von NSK-Primer-Komplexe bzw. NSKF-Primer-Komplexe an die Oberfiache 
(Bindung bzw. Immobilisierung von NSKs Oder NSKFs). 

Ziel der Fixierung (Immobilisierung) ist es, NSK-Primer-Kmplexe bzw. NSKF-Primer- 
Komplexe auf einer geeigneten planen Oberfiache in einer Art und Weise zu fixieren, 
15 dass eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Dies kann 
beispielsweise durch Bindung des Primers (s.o.) oder der NSKs bzw. NSKFs an die 
Oberfiache erfolgen. 

Die Reihenfolge der Schritte bei der Fixierung von NSK-Primer-Komplexen bzw. 
20 NSKF-Primer-Komplexen kann variabel sein: 

1) Die Komplexe konnen zunachst in einer Losung durch Hybridisierung 

(Annealing) gebildet und anschlieBend an die Oberfiache gebunden werden. 

2) Primer konnen zunachst auf einer Oberfiache gebunden werden und NSKs bzw. 

NSKFs anschlieBend an die gebundenen Primer hybridisiert werden, wobei 
25 z.B. NSKF-Primer-Komplexe entstehen (NSKFs indirekt an die Oberfiache 

gebunden) 

3) Die NSKs bzw. NSKFs konnen zunachst an die Oberfiache gebunden werden 

(z.B. NSKFs direkt an die Oberfiache gebunden) und im anschlieBenden 
Schritt die Primer an die gebundenen NSKs bzw. NSKFs hybridisiert werden, 
30 wobei NSK-Primer-Komplexen bzw. NSKF-Primer-Komplexe enstehen. 
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Die Immobilisierung der NSKs bzw. NSKFs an die Oberflache kann daher durch 
direkte oder indirekte Bindung erfolgen. 

In einer bevorzugten Ausfuhrungsform ist die Reaktionsoberflache ein Bestandteil des 
5 MFK, wobei das Material der Oberflache fOr die elektormagnetische Strahlung 
(Anregungs- und Fluoreszenzlicht) durchlassig ist. Dieses Material ist weiterhin 
enzymatischen Reaktionen gegenQber innert und verursacht keine Storungen der 
Detektion. Glas oder Kunststoff (z.B. PMMA), oder beliebiges anderes Material, das 
diesen funktionellen Anforderungen genQgt, kann verwendet werden. Vorzugsweise ist 
10 die Reaktionsoberflache nicht verformbar, denn sonst ist mit einer Verzerrung der 
Signale bei der wiederholten Detektion zu rechnen. 

Falls eine gelartige teste Phase (Oberflache eines Gels) verwendet wird, so kann 
dieses Gel z.B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise fur 

15 MolekQIe mit einer Molekularmasse unter 5000 Da frei passierbar (beispielsweise 
kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet 
werden). Eine solche Geloberflache hat anderen festen Reaktionsoberflachen 
gegenQber den Vorteil, dass es zu einer wesentlich geringeren unspezrfischen 
Bindung von NT*s an die Oberflache kommt. Durch die Bindung der NSKF-Primer- 

20 Komplexe auf der Oberflache ist die Detektion der Fluoreszenzsignale von 
eingebauten NTs* meglich. Die Signale von freien NTs* werden nicht detektiert, weil 
sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das 
Gel ist vorzugsweise auf einer festen Untertage befestigt. Diese feste Unteriage kann 
Glas oder Kunststoff (z.B. PMMA) sein. 

25 Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke ist 
vorzugsweise groBer als die einfache Tiefenscharfe des Objektivs sein, damit unspezi- 
fisch an die feste Unteriage gebundene NTs* nicht in die Fokusebene gelangen und 
damit detektiert werden. Wenn die Tiefenscharfe z.B. 0,3 pm betragt, so liegt die 
Geldicke vorzugsweise zwischen 1 urn und 100 urn. Die Oberflache kann als eine 

30 kontinuieriiche Oberflache oder als diskontinuierliche, aus einzelnen kleinen 
Bestandteilen (z.B. Agarose-KQgelchen) zusammengesetzte Oberflache hergestelft 



WO 03/031947 



PCT/EP02/11098 



-33- 

werden. Die ReakfionsoberflSche mu(J groB genug sein, urn die notwendige Anzahl 
der Komplexen bei entsprechender Dichte immobiiisieren zu kOnnen. Die Reaktions- 
oberflSche sollte vorzugsweise nicht grQBer als 20 cm 2 sein. 

5 Falls die Fixierung der NSKF-Primer-Komplexe auf der Oberfiache Qber die NSKFs 
erfolgt, kann dies beispielsweise durch die Bindung der NSKFs an einem der beiden 
Ketten-Enden erfolgen. Dies kann durch entsprechende kovalente, affine oder andere 
Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von 
Nukleinsauren bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 

10 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton Publishing, "DNA Microarrays" 
1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry 
v.198, S.138, Allemand et al. Biophysical Journal 1997, v.73, S.2064, Trabesinger et 
al. Analytical Chemistry 1999, v.71, S.279, Osborne et al. Analytical Chemistry 2000, 

15 v.72, S.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh 
et al. NAR 1987 v.15 S.5353, Gingeras et al. NAR 1987 v.15 S.5373, Maskos et al. 
NAR 1992 v.20 S.1679). Die Fixierung kann auch durch eine unspezifische Bindung, 
wie z.B. durch Austrocknung der NSKFs enthaltenden Probe auf der planen 
Oberfiache erreicht werden. Das Gleiche gilt auch fQr NSKs. 

20 

Die NSKs bzw. NSKFs werden auf der Oberflache beispielsweise in einer Dichte 
zwischen 10 und 100 NSks bzw. NSKFs pro 100 pm 2 , 100 bis 10.000 pro 100 pm 2 , 
10.000 bis 1.000.000 pro 100pm 2 gebunden. 

25 Die fQr die Detektion notwendige Dichte von extensionsfahigen NSK-Primer- 
Komplexen bzw. NSKF-Primer-Komplexen betr§gt ca. 10 bis 100 pro 100 pm 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer an die Genprodukte 
erreicht werden. 

30 Beispielhaft werden im folgenden einige Methoden zur Bindung von NSKF-Primer- 
Komplexen naher dargestelft: In einer AusfQhrungsfbrm erfolgt die Immobilisierung der 
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NSKFs Qber Biotin-Avidin oder Biotin-Streptavidin-Bindung. Dabei wird Avidin oder 
Streptavidin auf der Oberflache kovalent gebunden, das 5'-Ende des Primers enthalt 
Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs (in Losung) 
werden diese auf der mit Avidin/Streptavidin beschichteten Oberflache fixiert. Die 
5 Konzentration der mit Biotin markierten Hybridisierungs-Produkte sowie die Zeit der 
Inkubation dieser Losung mit der Oberflache wird so gewahlt, dass eine fur die 
Sequenzierung geeignete Dichte bereits in diesem Schritt erreicht wird. 

In einer anderen bevorzugten AusfQhrungsform werden die fur die 
10 Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion auf der 
Oberflache mit geeigneten Methoden fixiert (s.o.). Die einzelstrangigen NSKs oder 
NSKFs mit jeweils einer Primerbindungsstelle pro NSK oder NSKF werden damft 
unter Hybridisierungsbedingungen inkubiert (Annealing). Dabei binden sie an die 
fixierten Primer und werden dadurch gebunden (indirekte Bindung), wobei Primer- 
15 NSK-Komplexe oder Primer-NSKF-Komplexe entstehen. Die Konzentration der 
einzelstrangigen NSKs oder NSKFs und die Hybridisierungsbedingungen werden so 
gewahlt, dass man eine fur die Sequenzierung geeignete Immobilisationsdichte von 
10 bis 100 extensionsfahigen Komplexen pro 100 urn 2 erreicht Nach der 
Hybridisierung werden ungebundene NSKFs durch einen Waschschritt entfemt Bei 
20 dieser AusfQhrungsform wird eine Oberflache mit einer hohen Primerdichte bevorzugt, 
z.B. ca. 1.000.000 Primer pro 100um 2 oder noch heher, da die gewOnschte Dichte an 
NSK-Primer-Komplexen bzw. NSKF-Primer-Komplexen schneller erreicht wird, wobei 
die NSKs bzw. NSKFs nur an einen Teil der Primer binden. 

25 In einer anderen AusfQhrungsform werden die NSKs bzw. NSKFs an die Oberflache 
direkt gebunden (s.o.) und anschlieBend mit Primem unter 
Hybridisierungsbedingungen inkubiert. Bei einer Dichte von ca. 10 bis 100 NSKs bzw. 
NSKFs pro 100pm 2 wird man versuchen alle verfQgbanen NSKs bzw. NSKFs mit 
einem Primer zu versehen und fur die Sequenzierugnsreaktion verfugbar zu machen. 

30 Dies kann z.B. durch hohe Primerkonzentration (Gesamtkonzentration der Primer), 
beispielsweise 0.1 bis 10 mmol/l, erreicht werden. Bei einer hdheren Dichte der 
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fix.erten NSKs bzw. NSKFs auf der Oberflache, beispielsweise 10.000 bis 1 000 000 
pro 100um 2 , kann die fQr die optische Detektion notwendige Dichte der Komplexe 
wahrend der Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, Primerkonzentration) so 
5 zu wahlen, dass die Primer nur an einen Teil der immobilisierten NSKs bzw. NSKFs 
binden. 

Falls die Oberflache einer festen Phase (z.B. Silikon oder Glas) zur Immobilisation 
verwendet wird, wird vorzugsweise eine Blockiemngslosung auf die Oberflache vor 
10 dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen 
Adsorbtion von NTs* an der Oberflache dient. 

4.2 Beispiel Reaktionslosungen: 



15 



20 



Losung A: 50 mM Phosphat Puffer pH 8.5, 10% Glycerin, 5 mM Mg2 + , 1mM 
Mn2+, 

Losung B, (Reaktionslosung NT*(n)): LSsung A, Polymerase, markierte NT(n) 
LSsung C, (AbspaKungslosung): Lesung A, Spaltungsreagenzien 
LOsung D, die zu analysierende Probe in L6sung A 
Losung E (Waschlosung) ist gleich mit Losung A 
Losung F, 1mg/ml acetyliertes BSA in Losung A (eine BlockierungslOsung zur 
Reduktion der unspezifischen Bindung der NTs an die festen Oberflachen wie 
Glas, Silicon usw.) 

25 4.3 Beispiel Farbstoffe: 

Marker. Fluorfts7Antfgrhc*nff 

Jede Base ist mit einem fOr sie charakteristischen Marker (F) marklert. Der Marker 
30 .st ein fluoreszierender Farbstoff. Mehrere Faktoren beeinflussen die Wahl des 
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Fluoreezenzferbstoffes. Die Wahl 1st nicht eingesohrankt, sofem der Farbatoff 
folgenden Anforderungen genugt: 

a) Die verwendete Detektionsapparatur muS diesen Marker gebunden an DNA 

5 SLIT r d ' n9Un9en <TOra » SWeise * einzigea 

5 MolekQI .denbfaeren kannen. Die Farbatofle haben vorzugsweise groSe 

Photostabilitat. Ihre Fluoreszenz Wrd vorzugs»veise von der DNA nicht Oder nur 
unwesentlich gequencht. 

b) Der an das NT gebundene Farbstoff darf keine irreversible Storung der enzymati- 
10 schen Reaktion verursachen. 

0 mit dem Farbstoff markierte NTs mOssen von der Polymerase in die 
Nukleinsaurekette eingebaut werden. 



15 



20 



25 



30 



d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine 
betrachtlichen Uberlappungen in ihren Emissionsspektren aufweisen 
lm Rahmen der vorliegenden Erfindung verwendbare Ruoreszenzfarbstoffe sind in 
Handbook of Fluorescent Probes und Research Chemicals" 6th ed 1996 
KHaugland, Molecular Probes mit Strukturforme.n zusammengestellt' 
ErfindungsgemaB werden vorzugsweise folgende Farbstoffklassen als Marker 
emgesetzt: Cyanin-Farbstoffe und deren AbkSmmlinge (z.B. Cy2, Cy3 Cy5 Cy7 
Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und 
deren AbkSmmlinge (z.B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes s 
Handbuch), Xanthene-Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes Mao 
et al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell erhaltlich. 

Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur 
entsprechende Farbstoffe auswahlen. Die Farbstoffe werden an den Linker z B 
Ober Thiocyanat- oder Ester-Bindung gekoppelt ("Handbook of Fluorescent Probes 
und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et 
al. Methods in Enzymology 1997 v.278 S.363, Waggoner Methods in Enzymology 
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1995 v.246 S.362), s. auch Anmeldungen Tcherkassov et al. CVerfahren zur 
Bestimmung der Genexpression" DPuMA-Aktenzeichen 101 20 798.0-41, 
.Verfahren zur Analyse von Nukleinsaureketten" DPuMA-Aktenzeichen 101 20 
797.2-41, „Verfahren zur Analyse yon NukleinsSurekettensequenzen und der 
5 Genexpression" DPuMA-Aktenzeichen 101 42 256.3). 

Farbiges Kodierun gsschema. Anzahl der Farbstoffe (Farbkodieruna^ 
Einen Zyklus kann man durchfQhren mit: 

10 

a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei verschieden markierten NT*s und zwei unmarkierten NTs, 

15 

d.h. 

a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 
NTs gleichzeitig in die Reaktion einsetzen. Dabei erreicht man die Sequenzierung 
einer Nukleinsaurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der 

20 Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 
verschiedene Farbstoffe mQssen in jedem Zyklus identifiziert werden. 

b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen 
gewahlt werden. Dabei werden 2 Paare von NT*s gebildet, die jeweils verschieden 

25 markiert sind, z.B. A und G tragen die Markierung "X", C und U tragen die 
Markierung "Y". In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich 
markierte NT*s gleichzeitig eingesetzt, z.B. C* in Kombination mit A*, und im 
darauffolgenden Zyklus (n+1) werden dann U* und G* zugegeben. 



c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs 
verwenden und pro Zyklus nur ein NT* einsetzen. 
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d) In einer technisch vereinfachten AusfQhrungsform werden pro Zyklus zwei 
unterschiedlich markierte NT's eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s 
/ 2NTs-Methode). Diese AusfQhrungsform kann verwendet werden, urn Varianten 
5 (z.B. Mutationen, oder alternativ gesplei&te Gene) einer bereits bekannten Sequenz 
zu ermitteln. 

Andere mogliche Kombinationen sind naheliegend. 



10 4.4 Beispiel Detektion: 



1 ) Vorbereitung zur Detektion 

2) DurchfQhrung eines Detektionsschrittes in jedem Zyklus. Das Diagramm in Fig. 
8 stellt beispielhaft den Ablauf der Detetktion an einem Objektfeld, wobei 
4NT*s (NT* 1|2| 3 f 4) mit verschiedenen Farbstoffen markiert sind und in einer 
Reaktion in die immobilisierten NSKs eingebaut wurden. Jeder 
Detektionsschritt lauft als Scannvorgang ab und schlieBt folgende Operationen 
ein: 



20 a) Einstellung der Position des Objektivs (X.Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse), 

c) . Detektion der Signale einzelner Molekule, Zuordnung des Signals zu 

NT* und Zuordnung des Signals zur jeweiligen NSK bzw. NSKF, 

d) Verschiebung zur nSchsten Position auf der OberflSche. 



25 



Die Signale von in die NSKs bzw. NSKFs eingebauten NT*s werden durch das 
Abscannen der Oberfiache registriert. Dabei wird das Objektiv schrittweise Qber die 
Oberflache bewegt (Rg. 7), so dass von jeder Oberflachenposition (Objektfeld) ein 
zweidimensionales Bild (2D-Bild) entsteht 
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1) Vorbereitung zur Detektion: 

Bei der Sequenzierung langer Nukleinsiureketten (z.B. 1Mb langen DNA-StOcks) 
w.rd am Anfang festgelegt, wie viele NSKFs zur Rekonstruktion der ursprQnglichen 
Sequenz analysiert werden mOssen. Im Fall einer Rekonstruktion nach dem 
SchrotschuB-Verfahren f Automated DNA sequencing and analysis" S. 231 ff. 1994 
M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 S.868 Huang 
Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 v.23 S.4992, Miller et al 
J.ComputBiol. 1994 v.1 S.257) spielen folgende Faktoren eine Rolle: 

1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs 
bestimmt. 

2) Die Gesamtlange derzu analysierenden Sequenz istwichtig. 

3) Bei der Sequenzierung mull ein bestimmtes MaB an Redundanz erreicht werden, 
urn die Genauigkeit zu steigem und eventuelle Fehler zu korrigieren. 

Insgesamt ist zur Rekonstruktion des groBten Teils der ursprQnglichen Sequenz die 
etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d.h. bei diesem 
Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten gebraucht. Bei einer 
durchschnittlichen Sequenzlange von 400 bp pro NSKF benotigt man entsprechend 
25.000 bis 250.000 DNA-Fragmente. 

Bei der Analyse der Genexpression wird festgelegt, wie viele Kopien der 
Genprodukte zur Expressionsanalyse notwendig sind. Mehrere Faktoren spielen 
dabei eine Rolle. Die genaue Zahl hangt z.B. von der relativen Prasenz der 
Genprodukte im Ansatz und von der gewunschten Genauigkeit der Analyse ab. Die 
Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 
10.000.000. FQr stark exprimierte Gene kann die Anzahl der analysierten 
Genprodukte niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse schwach 
exprimierter Gene muB sie erheht werden, z.B. auf 100.000 oder noch weiter. 
Es werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig analysiert 
Dabei werden auch schwach exprimierte Gene (mit z.B. ca.100 mRNA- 
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MolekQIen/Zelle, was ca. 0.02% gesamt-mRNA entspricht) in der Reaktion mit 
durchschnittlich 20 identifizierten Genprodukten reprasentiert. 

Die Ermittlung der Gesamtzahl (N 0F ) der Objektfelder, die abgescannt werden 
5 mOssen: 

Die Anzahl (N NS k) der zu analysierenden NSKs / NSKFs zusammen mit der 
durchschnittliche Dichte der an der Sequenzierungsreaktion beteiligten NSKs 
/NSKFs pro Objektfeld (D) bestimmen die Anzahl (Nof) der Objektfelder, die 
abgescannt werden mussen. Der Hauptcomputer errechnet diese N 0 f wShrend des 
10 ersten Zyklus. 

2) Die DurchfOhrung eines Detektionsschrittes in jedem Zyklus wird am Beispiel der 
Sequenzierung einer langen Nukleinsaurekette erlautert. 

Zur Sequenzierung mQssen die X.Y-Positionen der NSKFs auf der Oberfiache 
15 bestimmt werden, damit man eine Grundlage fQr die Zuordnung der Signale hat. Die 
Kenntnis dieser Positionen erlaubt eine Aussage darOber, ob die Signale einzelner 
MolekQIe von eingebauten NT*s stammen oder von zufallig an die Oberfiache 
gebundenen NTs. Diese X,Y-Positionen kfinnen mit verschiedenen Methoden 
identifiziert werden. 

20 

In einer bevorzugten AusfQhrungsform werden die X,Y-Positionen immobilisierter 
NSKFs wahrend der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, 
daS die Signale von den in die Nukleinsaurekette eingebauten NTs immer 
dieselben Koordinaten haben. Das ist durch die Fixierung der NukleinsSureketten 
25 gewahrleistet Die unspezifisch gebundenen NTs binden zufallig an verschiedene 
Stellen der Oberfiache. 

Zur Identifizierung der X.Y-Positionen von fixierten NSKFs werden die Signale auf 
Gbereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen 
30 QberprGtt. Das kann z.B. am Anfang der Sequenzierung erfolgen. Die 
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Gbereinstimmenden Koordinaten werden als Koordinaten der DNA-Fragmente 
bewertet und gespeichert 

Das Scan-System muB reproduzierbar Qber mehrere Zyklen die Oberflache 
. abscannen konnen. X,Y und 2-Achsen-Einstellungen an jeder Oberflachenposition 
kbnnen von einem Computer kontrolliert werden. Die Stabilitat und 
Reproduzierbarkeit der Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden Qber die Qualitat der Detektion und somit Qber die Identifizierung der 
Signale einzelner MolekQIe. 

* 

a) Einstellung der Position des Objektivs (X,Y-Achse)Die mechanische Instability 
der kommerziell erhaltlichen Scantische und die geringe Reproduzierbarkeit der 
wiederholten Einstellung derselben X.Y-Positionen machen eine prazise Analysen 
der Signale einzelner MolekQIe Qber mehrere Zyklen schwierig. Es existieren viele 
MSglichkeiten, eine Obereinstimmung der Koordinaten bei wiederholten 
Einstellungen zu verbessem bzw. mogliche Abweichungen zu kontrollieren Als 
Beispiel wird eine KontrollmOglichkeit angefOhrt. Nach einer groben mechanischen 
Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberflache 
test verbundenen Muster aufgenommen. Auch wenn die mechanische Einstellung 
nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu mehreren urn 
sind Ober mehrere Zyklen durchaus rndglich), kann man mittels optischer Kontrolle 
eine Korrektur vomehmen. Das Kontrollbild vom Muster dient als 
Koordinatensystem fflr das Bild mit Signalen von eingebauten NTs. Eine 
Voraussetzung fOr eine solche Korrektur 1st. daB keine weiteren Bewegungen der 
Oberflache zwischen diesen beiden Aufnahmen gemacht werden. Signale von 
einzelnen Molekulen werden in Relation zum Muster gesetzt, so daB eine X Y- 
Abweichung in der Musterposition gleiche X,Y-Abweichung in der Position der 
Signale einzelner MolekQIe bedeutet. Das Kontrollbild vom Muster kann vor 
wihrend oder nach der Detektion einzelner MolekQIe aufgenommen werden. Ein 
solches Kontrollbild muB entsprechend bei jeder Einstellung auf einer neuen 
Oberflichenposition gemacht werden. 
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b) Einstellung cler Fokusebene (Z-Achse) 
5 Die OberflSche ist nicht absolut plan und weist verschiedene Unebenheiten auf. 
Dadurch verandert sich der Oberflache-Objektiv-Abstand beim abscannen 
benachbarter Stellen. Diese Unterschiede im Abstand konnen dazu fUhren, daB 
einzelne Molekule die Fokusebene verlassen und so der Detektion entgehen. 
Aus diesem Grund ist es wichtig, dalJ beim Abscannen der Oberflache die 

10 Fokusebene korrekt eingestellt wird, bevor eine Aufnahme der Signale von 
einzelnen MolekQIen an jedem Objektfeld durchgefQhrt wird. Dies geschieht 
vorzugsweise durch die Einstellung der Fokusebene auf ein bestimmtes Muster, das 
mit der Reaktionsoberflache test verbunden ist. Dieses Muster kann z.B. durch 
Teilchen mit einem Durchmesser von ca. 1pm gebildet werden. Diese Teilchen 

15 konnen z.B. im Durchlicht-Beleuchtungsmodus visualisiert werden. AnschlieBend 
wird auf den Fluoreszenzmodus umgeschaltet und Signale von einzelnen MolekQIen 
detektiert. 

In einer AusfQhrungsform erfolgt die Visualisierung des Einstellungsmuster durch 
20 die Beleuchtung von unten. Dazu enthait die Reaktionsplattforrn eine Offnung in 
dem unteren Teil, so dass die Reaktionsoberflache von unten beleuchtet werden 
kann, z.B. mit Durchlicht- oder Phasenkontrastbeleuchtung (Fig. 4a). 
In einer anderen AusfQhrungsform kann das Einstellungsmuster selbst 
fluoreszieren, so dass bei einer entsprechenden Beleuchtung das 
25 Einstellungsmuster im Fluoreszenzmodus visualisiert werden kann (Fig. 4b). 

Vorzugsweise wird fGr die Visualisierung des Einstellungsmusters das Licht einer 
anderen WellenlSnge verwendet, die Detektion der Signale von einzelnen 
MolekQIen nicht stort. 

30 c) Detektion der Signale einzelner MolekOIe, Zuordnung des Signals zu NT* und 
Zuordnung des Signals zur jeweiiigen NSK. 
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Das rnlt Hilfe des Detektionssystems erzeugte zweidimensionale Bild der 
Reaktionsoberfiache enthSIt die Signalinformationen von vielen in die NSKFs 
eingebauten NTs. Diese miissen vor der weiteren Verarbeitung aus der 
Gesamtdatenmenge der Bildinformationen mit geeigneten Methoden extrahiert 
5 werden. Die dazu notwendigen Algorithmen zur Skalierung, Transfprmation und 
Filterung der Bildinformationen zahlen zum Standardrepertoir der digitalen 
Bildverarbeitung und Mustererkennung (Haberacker P. "Praxis der Digitalen 
Bildverarbeitung und Mustererkennung". Hanser-Verlag, MQnchen, Wien, 1995; 
Galbiati L.J. "Machine vision and digital image processing fundamentals". Prentice 

10 Hall, Englewood Cliffs, New Jersey, 1990). Die Signalextraktion erfolgt 
beispielsweise Ober ein Grauwertbild, das die Helligkeitsverteilung der Reaktions- 
oberflache fur den jeweiligen Fluoreszenzkanal abbildet Wenn bei der 
Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen Fluoreszenz- 
Farbstoffen verwendet werden, kann zunachst fur jedes verwendete 

15 'fluoreszenzmarkierte Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild 
erzeugt werden. DafQr k6nnen prinzipiell 2 Verfahren angewendet werden: 

1. Durch Verwendung von geeigneten Filtern (z.B. Zeiss-Filtersatze) wird fQr jeden 

Fluoreszenzkanal ein Grauwertbild erzeugt. 
20 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines 

geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten 

Farbkanale extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur 

Kanalextraktion wird dabei ein fQr den jeweiligen Kanal spezifischer Farb- 

Schwellwertalgorithmus eingesetzt}. So entstehen zunachst aus einem Mehrkanal- 
25 Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt: 

GB N = (s(x,y)) einkanaliges Grauwertbild 

N={1,...,Anzahl der FluoreszenzkanSle}. 

M={0, 1 , . . . ,255} Grauwertmenge 

S=(s(x,y)) Bildmatrix des Grauwertbildes 

30 x=0,1,...,L-1 Bildzeilen 

y=0 f 1 R-1 Bildspalten 
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(x,y) 

s(x,y)? M 



Ortskoordinaten eines Bildpunktes 
Grauwert des Bildpunktes. 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante 
5 Bildinformation extrahiert Ein solches Programm sollte folgende Arbeitsschritte 
realisieren: 

Fur GBi bis GB N durchfQhren: 

10 I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des 
durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa 
durch Grauwertgiattung. 

II. Prufung jedes Bildpunktes (x,y) des Grauwertbildes, ob dieser Punkt im 
15 Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten 
Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfQIIt. Diese 
Eigenschaften hangen unter anderem von der verwendeten Detektionsapparatur 
und der Auflasung des Grauwertbildes ab. Sie konnen beispielsweise ein typisches 
Verteilungsmuster von Helligkeits-lntensitatswerten Qber einer den Bildpunkt 
20 umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der 
Bildsegmentierung reichen von einfachen Schwellwertverfahren bis hin zur 
Verwendung neuronaler Netze. 

Erfullt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein Vergleich mrt den 
25 Koordinaten von in bisher durchgefQhrten Sequenzierungszyklen identifizierten 
NSKFs. Bei einer Obereinstimmung erfolgt die Zuordnung des Signals mit dem aus 
dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem NSKF. 
Signale mit nicht Obereinstimmenden Koordinaten werden als Hintergrundsignale 
bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang 
30 erfolgen. 
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ln einer beispielhaften AusfQhrung wird ein 8-Bit-Grauwertbild mit einer Aufldsung 
von 1317 x 1035 Pixel verwendet. Urn die durch die Digitalisierung entstandenen 
Veranderungen am Bild zu reduzieren, erfolgt zunachst eine Vorverarbeitung des 
Gesamtbildes: Jedem Bildpunkt wird der Mittelwert der Helligkeiten seiner 
5 acht-Nachbarn zugewiesen. Bei der gewahlten Auflosung entsteht dadurch ein fQr 
einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunktes mit dem 
grSfiten Helligkeitswert und Nachbarbildpunkten mit nach alien Seiten hin 
abfallenden Helligkeiten. Erfullt ein Bildpunkt diese Kritierien und Oberschritt der 
zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu 
10 schwacher Fluoreszenzpunkte), dann wird dieser zentrale Bildpunkt als Koordinate 
eines Fluoreszenzpunktes gewertet. 

* 

d) Verschiebung des Objektivs zur nachsten Position auf der Oberflache. Nach der 
Detektion der Signale einzelner MolekOle wird das Objektiv Ober einer anderen 
15 Position der Oberflache positioniert. 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der 
X,Y-Position t der Einstellung der Fokusebene und mit der Detektion einzelner 
MolekOle bei jeder neuen Objektivposition gemacht werden. Diese Schritte werden 
20 durch einen Computer gesteuert. 

4.5 Beispiel Sequenzanalyse: 

Sequenzanalyse mit 4 markierten NTs wobei in einer bevorzugten 
AusfQhrungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs 
25 mit verschiedenen Fluoreszenzfarbstoffen markiert und gleichzeitig in die Reaktion 
eingesetzt. Diese AusfOhrungsform kann beispielsweise for unten angefOhrte 
Analysen verwendet werden. 

4.5.A Sequenzierung langer Nukleinsauren 

30 Diesem Verfahren liegt die Rekonstruktion der ursprOnglichen Sequenzen nach dem 
SchrotschuB-Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 
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ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 S.868, 
Huang Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 v.23 S.4992, Miller et al. 
J.ComputBioI. 1994 v.1 S.257). (Dieses Prinzip ist insbesondere bei der Analyse 
neuer, unbekannter Sequenzen geeignet.) 

5 

Sequenzierung eines langen DNA-Stucks 

Im folgenden soil anhand der Sequenzierung eines 1Mb langen DNA-StOckes 
schematisch die Sequenzierung langer Nukleinsaureketten dargestellt werden. Der 
Sequenzierung liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequencing 

10 and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom 
Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 
v.23 S.4992, Miller et al. J.ComputBioI. 1994 v.1 S.257). Das zu analysierende 
Material wird fQr die Sequenzierungsreaktion vorbereitet, indem es in Fragmente 
von vorzugsweise 50 bis 1000 bp Uinge zerlegt wird. Jedes Fragment wird 

15 anschlie&end mit einer Primerbindungsstelle und einem Primer versehen. Dieses 
Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen 
Oberflache fixiert Die nicht gebundenen DNA-Fragmente werden durch einen 
Waschschritt entfernt Danach wird die Sequenzierungsreaktion an der gesamten 
Reaktionsoberflache durchgefuhrt. Zur Rekonstruktion einer 1 Mb langen DNA- 

20 Sequenz sollten die Sequenzen von NSKFs vorzugsweise linger als 300 NTs sein, 
durchschnittlich ca. 400 bp. Da pro Zyklus nur jeweils ein markiertes NT* eingebaut 
wird, sind mindestens 400 Zyklen zur Sequenzierung notwendig. 

Insgesamt ist zur Rekonstruktion der ursprtlnglichen Sequenz die etwa 10- bis 100- 
25 fache Menge an Rohsequenzen erforderiich, d.h. 10 bis 100 Mb. Bei einer 
durchschnittlichen SequenzlSnge von ca. 400 bp pro NSKF benatigt man entspre- 
chend 25.000 bis 250.000 DNA-Fragmente, urn mehr als 99,995% der 
Gesamtsequenz abzudecken. 

Die ermittelten NSKF-Sequenzen stellen eine Population von Qberlappenden 
30 Teilsequenzen dar, die sich mit kommerziell erhaitlichen Programmen zur 
Gesamtsequenz der NSK zusammenfOgen lassen ("Automated DNA sequencing 



WO 03/031947 



PCT/EP02/11098 



-47- 



and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press , Huang et al. Genom 
Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 
v.23 S.4992, Miller et al. J.Comput.Biol. 1994 v.1 S.257). 

Sequenzierung der Genprodukte am Beispiel der cDNA-Sequenzierung 

In einer bevorzugten AusfQhrungsform kSnnen statt einer Sequenz mehrere 
Sequenzen in einem Ansatz analysiert werden. Die ursprtlnglichen Sequenzen 
konnen aus den gewonnen Rohdaten z.B. nach dem SchrotschuB-Prinzip 
rekonstruiert werden. 

Zunachst werden NSKFs erzeugt. Man kann z.B. mRNA in eine dop- 
pelstrangige cDNA Oberfuhren und diese cDNA mit Ultraschall fragmentieren. 
AnschlieBend werden diese NSKFs mit einer Primerbindungsstelle versehen, 
denaturiert, immobilisiert und mit einem Primer hybridisiert. Zu beachten ist bei 
dieser Variante der Probenvorbereitung, dad die cDNA-Molekiile 
unvollstandige mRNA-Sequenzen darstellen kSnnen (Method in Enzymology 
1999, v.303, S.19 und andere Artikel in diesem Band, "cDNA library protocols" 
1997 Humana Press). 

Eine andere MOglichkeit bei der Generierung einzelstrangiger NSKFs von 
mRNA besteht in der reversen Transkription der mRNA mit randomisierten 
Primem. Dabei werden viele relativ kurze antisense DNA-Fragmente gebildet 
(Zhang-J et al. Biochem.J. 1999 v.337 S.231, Ledbetter et al. J.Biol.Chem. 
1994 v.269 S.31544, Kolls et al. Anal.Biochem. 1993 v.208 S.264, Decraene 
et al. Biotechniques 1999 v.27 S.962). Diese Fragmente k6nnen anschlie&end 

werden (s.o). Weitere Schritte 
entsprechen oben beschriebenen Vorgangen. Mit dieser Methode konnen 
komplette mRNA-Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden, da 
die randomisierten Primer Qber die gesamte Lange der mRNA binden. 



WO 03/031947 



PCT/EP02/11098 



-48- 

Immobilisierte NSKFs werden mit einer der oben angeftlhrten Aus- 
fOhrungsformen der Sequenzierung analysiert. Da mRNA-Sequenzen 
wesentlich weniger repetitive Sequenzen aufweisen als z.B. genomische DNA, 
kann die Anzahl der detektierten Signale der eingebauten NTs von einem 
5 NSKF geringer als 300 sein und liegt vorzugsweise zwischen 20 und 1000. Die 

Anzahl der NSKFs, die analysiert werden mQssen, errechnet sich nach densel- 
ben Prinzipien wie bei einer SchrotschuB-Rekonstruktion einer langen 
Sequenz. 

10 Aus NSKF-Sequenzen werden nach den Prinzipien des SchrotschuU- 
Verfahrens die ursprunglichen Gensequenzen rekonstruiert. 

Diese Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs 
ohne vorherige Klonierung. 

15 

4.5. B Genexpressionsanalyse: 

Sequenzanalyse mit 4 markierten NTs 

20 Bei einer bevorzugten AusfQhrungsform der Erfindung werden alle vier in die 
Reaktion eingesetzten NTs mit Fluoreszenzfarbstoffen markiert. 
Dabei verwendet man eine der oben genannten farbigen Kodierungsschemata. Die 
Zahl der ermittelten NTs fQr jede Sequenz aus einem Genprodukt liegt zwischen 5 
und 1 00, idealerweise zwischen 20 und 50. 

25 

Analyse 

Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines Programms mit 
bekannten Gensequenzen vergiichen. Einem solchen Programm kann z.B. ein 
BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational 
30 Biology" 1995 M.S. Waterman Chapman & Hall). 
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4 

Durch die Wahl der Methode zur Materialvorbereitung wird unter anderem 
festgelegt, in weichen Abschnitten der Genprodukte die Sequenzen ermittelt werden 
und zu welchem Strang (sense oder antisense) sie gehSren. Z.B. werden bei der 
Verwendung der polyA-Strecken als Primerbindungsstelle in mRNA Sequenzen aus 
5 NTRs (non-translating-regions) bestimmt. Bei der Verwendung der Methode mit 
antisense-cDNA als Matrize stammen die ermittelten Sequenzen unter anderem aus 
den proteinkodierenden Bereichen der Genprodukte. 

Bei einer bevorzugten einfachen Variante der Erfindung wird die Genexpression nur 
10 qualitativ bestimmt. Dabei ist nur die Tatsache der Expression bestimmter Gene von 
Bedeutung. 

Bei einer anderen bevorzugten Ausfuhrungsform ist eine quantitative Bestimmung 
der Verhaltnisse zwischen einzelnen Genprodukten im Ansatz von Interesse. Es ist 
15 bekannt, dad die Aktivitat eines Gens in einer Zelle durch eine Population 
identischer mRNA-MolekQIe reprasentiert ist. In einer Zelle sind viele Gene 
gleichzeitig aktiv und werden dabei unterschiedlich stark exprimiert, was zum 
Vorhandensein vieler verschiedener unterschiedlich stark reprasentierter mRNA- 
Populationen fuhrt. 

20 

Im folgenden wird auf die quantitative Analyse der Genexpression n§her 
eingegangen: 

FOr eine quantitative Analyse der Genexpression werden die Abundanzen einzelner 
Genprodukte in der Sequenzierungsreaktion bestimmt. Dabei sind die Produkte 
25 stark exprimierter Gene in der Sequenzierungsreaktion haufiger vertreten als die 

♦ 

schwach exprimierter Gene. 

Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der Anteil der 
ermittelten Sequenzen fQr jedes einzelne Gen bestimmt. Gene mit starker 
Expression haben einen hSheren Anteil an der Gesamtpopulation der Genprodukte 
30 als Gene mit schwacher Expression. 
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Die Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 
10.000.000. Die genaue Anzahl der zu analysierenden Genprodukte hSngt von der 
Aufgabenstellung ab. FOr stark exprimierte Gene kann sie niedrig sein, z.B. 1000 bis 
10.000. Bei der Analyse schwach exprimierter Gene muB sie erhQht werden, z.B. 
5 auf 100.000 oder h6her. 

Werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig analysiert, sind 
auch schwach exprimierte Gene, wie z.B. ca.100 mRNA-MolekQIe/Zelle (was ca. 
0.02% gesamt-mRNA entspricht), in der Reaktion mit durchschnittlich 20 
identrfizierten Genprodukten reprSsentiert. 

10 

Als interne Kontrolle der Hybridisierung, der Immobilisation und der 
Sequenzierungsreaktion laBt sich folgende Methode verwenden: 
Es konnen eine oder mehrere NukleinsSureketten mit bekannten Sequenzen als 
Kontrolle eingesetzt werden. Die Zusammensetzung dieser Kontrollsequenzen ist 

15 nicht eingeschrankt, sofem sie die Identifizierung der Genprodukte nicht storten. Bei 
der Sequenzanalyse der mRNA-Proben werden RNA-Kontrollproben, bei der 
Analyse der cDNA-Proben entsprechend DNA-Kontrollproben eingesetzt. Diese 
Proben werden vorzugsweise bei alien Schritten mitgefdhrt. Sie k6nnen z.B. nach 
der mRNA-lsolation zugegeben werden. Im allgemeinen werden die Kontrollproben 

20 in gleicher Weise zur Sequenzanalyse vorbereitet wie die zu analysierenden 
Genprodukte. 

Die Kontrollsequenzen werden in bekannten, fest eingestellten Konzentrationen zu 
den . zu analysierenden Genprodukten zugegeben. Konzentrationen der 
25 Kontrollproben k6nnen unterschiedlich sein, vorzugsweise liegen diese 
Konzentrationen zwischen 0.01% und 10% der Gesamtkonzentration der zu 
analysierenden Probe (100%). Betragt die Konzentration der mRNA beispielsweise 
10ng/pl, dann liegen die Konzentrationen von Kontrollproben zwischen 1pg/pl und 
1ng/pl. 

30 
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Bei der quantitativen Analyse der Genexpression muB auch die allgemeine 
metabolische Aktivitat der Zellen bertlcksichtigt werden, insbesondere, wenn ein 
Vergleich der Expression bestimmter Gene bei verschiedenen auBeren 
Bedingungen angestrebt wird. 

5 Die Veranderung im Expressionsniveau eines bestimmten Gens kann als Folge der 
Veranderung in der Transkriptionsrate dieses Gens oder als Folge einer globalen 
Veranderung der Genexpression in der Zelle auftreten. Zur Beobachtung der 
metabolischen Zustande in der Zelle kann man die Expression der sogenannten 
"House-keeping-Gene" analysieren. Beim Mangel an wichtigen Metaboliten ist 

10 beispielsweise das allgemeine Expressionsniveau in der Zelle niedrig, so daB auch 
konstitutiv exprimierte Gene eine niedriges Expressionsniveau haben. 
Im Prinzip konnen alle konstitutiv exprimierten Gene als "House-keeping-Gene" 
dienen. Als Beispiele seien das Transferrin-Rezeptor-Gen oder das Beta-Aktin-Gen 
genannt. 

15 Die Expression dieser House-keeping-Gene dient somit als BezugsgroBe fur die 
Analyse der Expression anderer Gene. Die Sequenzermittlung und Quantifizierung 
der Expression der House-keeping-Gene ist vorzugsweise ein Bestandteil des 
Analyse-Programms fur die Genexpression. 

20 4.6 Beispiel Polymerasen: 

Bei der Wahl der Polymerase spielt die Art der verwendeten fixierten Nukleinsaure 
(RNA oder DNA) eine entscheidende Rolle: 

Falls RNA als NSKs oder NSKFs oder Genprodukt (z.B. mRIMA) in die 
25 Sequenzierungsreaktion eingesetzt wird, kOnnen handelsQbliche RNA-abhangige 
DNA-Polymerasen eingesetzt werden, z.B. AMV-Reverse Transcriptase (Sigma), M- 
MLV Reverse Transcriptase (Sigma), HIV-Reverse Transcriptase ohne RNAse- 
Aktivitat. Alle Reverse Transcriptasen mQssen von RNAse-AktMtat weitgehend frei 
sein ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory). 
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10 



Falls DNA als NSKs oder NSKFs oder Genprodukt (z.B. cDNA) verwendet wird, 
eignen sich als Polymerasen prinzipiell alle DNA-abhangigen DNA-Polymerasen 
ohne 3'-5' Exonuklease-Aktivitat (DNA-Replication» 1992 Ed. A.Kornberg, Freeman 
and company NY), z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech), Klenow Fragment der DNA-Polymerase I ohne 3'-5' 
Exonukleaseaktivitat (Amersham Pharmacia Biotech), Polymerase Beta ver- 
schiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M., CRC Press 
Inc., kommerziell erhaltlich bei Chimerx) thermostabile Polymerasen wie 
beispielsweise Taq-Polymerase (GibcoBRL), proHA-DNA-Polymerase (Eurogentec). 

Polymerasen mit 3'-5' Exonuklease-Aktivitat k6nnen eingesetzt werden (z.B. Klenow- 
Fragment der E.coli-Polymerase I), sofem Reaktionsbedingungen gewahlt werden, die 
vorhandene 3'-5' Exonuklease-Aktivitat unterdrucken, wie z.B. ein niedriger pH-Wert 
(pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem. 1964 v.239 
S.233) oder Zugabe von NaF zur Einbaureaktion. Eine andere Mdglichkeit besteht in 
der Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel et al. 
PNAS 1981, v.78 S.6734). Dabei werden eingebaute NTs* von der 3'-5' Exonuklease- 
Aktivitat der Polymerase nicht angegriffen. Im folgenden werden all diese 
Polymerasearten als "Polymerase" bezeichnet. 

4.7 Beispiel modiflzierte Nukleotide: 

FQr die hoch parallele Sequenzierung mit einzelnen MolekQIen (parallele 
Sequenzanalyse von bis zu 10.000.000 NukleinsauremolekOlen) ist wichtig, dass 
jedes eingebaute NT* wahrend der Sequezierungsreaktion identifiziert wird! Eine 
25 Voraussetzung dafQr ist, dass nur ein einziges NT* pro Zyklus in die Nukleinsaurekette 
eingebaut wird. 

Das wird erreicht durch eine reversible Kopplung einer zur Tennination fOherenden 
Gruppe. Diese Gruppe kann sowohl an der Base (z.B. 5-Position der Pyrimidine bzw. 
7 Position der 7-Deazapurine) als auch an der 3'-Posrtion der Ribose bzw. 2'- 
30 Deoxyribose des Nukleotides gekoppeft sein. 



20 
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Falls diese Gruppe an der Base gekoppelt ist, so ist sie eine sterisch anspruchsvolle 
Gruppe, die durch ihre chemische Stmktur die Eigenschaften der mit dieser Gruppe 
gekoppelten NTs* so verandert, dass diese durch eine Polymerase in einer 
Extensionsreaktion nicht nacheinander eingebaut werden konnen. Wenn ein 
5 Reaktionsgemisch, das nur modifizierte NTs* enthSIt, in der Reaktion eingesetzl wird, 
dann kann die Polymerase nur ein einziges NT* einbauen. Der Einbau eines nachsten 
NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren der Synthese 
auf. Nach der Entfernung der sterisch anspruchsvollen Gruppe kann das nSchste 
komplementare NT* eingebaut werden. Weil diese NTs* kein absolutes Hindemis zur 
10 weiteren Synthese darstellen, sondem nur fDr den Einbau eines weiteren markierten 
NT*, werden sie als Semiterminatoren bezeichnet. 

Allgemeine Struktur des NT* mit sterischer Hinderung: 

Ihre gemeinsamen Merkmale sind in Fig. 9a,b,d dargestellt. Diese Struktur ist dadurch 
15 charakterisiert, dass an der Base uber einen spaltbaren Linker (A-E) eine sterische 
Gruppe (D) und der Fluoreszenzmarker (F) gebunden sind. 

Als Grundlage fQr die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A), 
Guanosin(G), Cytidin (C) und Uridin (U) als Nukleosidrest. Anstelle von Guanosin 
20 kann Inosin verwendet werden. 

Natur der sterisch anspruchsvollen Gruppe 

Die Gruppe (D) (Fig. 9a,b f d) stellt ein Hindemis fQr den Einbau eines weiteren 
komplementaren markierten NT* durch eine Polymerase dar. 

25 

Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine 
und Cy3-Farbstoff stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe 
dar (Zhu et al. Cytometry 1997, v.28, S.206, Zhu et al. NAR 1994, v.22, S.3418, 
Gebeyehu et al., NAR 1987, v.15, S.4513, Wiemann et al. Analytical Biochemistry 
30 1996, v.234, S.166, Heer et al. BioTechniques 1994 v.16 S.54). Die chemische 
Struktur dieser Gruppe ist nicht eingeschrSnkt, sofem sie den Einbau des markierten 
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NT\ an das sie geknOpft ist, nicht wesentlich st6rt und keine irreversible StSrung der 
enzymatischen Reaktion verursacht. 

Diese Gruppe kann als selbstandiger Teil im Linker (6a) auftreten oder mit dem 
5 Farbstoff (9b) oder der spaftbaren Gruppe (9d) identisch sein. Durch die Spaltung des 
Linkers wird diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals 
entfemt, so dass die Polymerase ein weiteres markiertes NT* einbauen kann. Bei 
einer Struktur wie in 6d wird die sterische Gruppe durch die Spaltung beseitigt. 

10 In einer bevorzugten Ausftlhrungsform ubemimmt der Fluoreszenzfarbstoff die 
Funktion einer solchen sterisch anspruchsvollen Gruppe, so dass ein markiertes 
Nukleotid eine in Fig. 9b dargestellte Struktur aufweist 

In einer anderen bevorzugten AusfOhrungsform ubemimmt die photolabile spaltbare 
15 Gruppe die Funktion einer solchen sterisch anspruchsvollen Gruppe (Fig. 9d). 

Linker 

Der Marker (Fluoreszenzfarbstoff) ist an die Base vorzugsweise uber einen 
Abstandhalter unterschiedlicher L§nge, einen sog. Linker, gebunden. Beispiele fOr 

20 Linker sind in Fig. 9e,f,g,h,i,j gegeben. Beispiele der Ankoppelung eines Linkers an die 
Base konnen aus folgenden Quellen entnommen werden (Hobbs et al. US Patent 
5.047.519, Khan et al. US Patent 5.821.356, Klevan et al. US Patent 4.828.979, 
Hanna M. Method in Enzymology 1996 v.274, S.403, Zhu et al. NAR 1994 v.22 
S.3418, Herman et al. Methods in Enzymology 1990 v. 184 S.584, J.LRuth et al. 

25 Molecular Pharmacology 1981 v.20 S.415, L Otvos et al. NAR 1987 v.15 S.1763, 
G.E.Wright et al. Phamiac Ther. 1990 v.47, S.447, Nucleotide Analogs; Synthesis 
and Biological Function" K.H. Scheil 1980, Wiley-lnterscience Publication, "Nucleic 
acid chemistry" Ed. LB.Townsend, v.1-4, Wiley-lnterscience Publication, "Chemistry 
of Nucleosides and Nucleotides" Ed. LB.Townsend, v.1-3, Plenum Press). 

30 
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Die gesamte Lange des Linkers kann variieren. Sie entspricht der Anzahl der 
Kohlenstoff-Atome in den Abschnitten A, C f E (Fig. 9a,b,d) und liegt vorzugsweise 
zwischen 3 und 20. Optimalerweise betragt sie zwischen 4 und 10 Atomen. Die 
chemische Zusammensetzung des Linkers (Abschnitte A,C,E in Fig. 9a,b,d) ist nicht 
5 eingeschrankt, sofern sie unter Reaktionsbedingungen stabil bleibt und keine StSrung 
der enzymatischen Reaktion verursacht. 

Spaltbare Verbindung, Spaltung: 

10 Der Linker trSgt eine spattbare Verbindung Oder spaltbare Gruppe (Abschnitt (B) in 
Fig. 9a,b,d). Diese spaltbare Verbindung ermoglicht die Entfernung des Markers und 
des sterischen Hindemisses am Ende jedes Zyklus. Ihre Wahl ist nicht eingeschrankt, 
sofern sie unter den Bedingungen der enzymatischen Sequenzierungsreaktion stabil 
bleibt, keine irreversible Storung der Polymerase verursacht und unter milden 

15 Bedingungen abgespalten werden kann. Unter "milden Bedingungen" sind solche 
Bedingungen zu verstehen, die den Genprodukt-Primer-Komplex nicht zerstSren, 
wobei z.B. der pH-Wert vorzugsweise zwischen 3 und 11 liegt, die Temperatur 
zwischen 0°C und einem Temperaturwert (x). Dieser Temperaturwert (x) hSngt von 
der Tm des Genprodukt-Primer-Komplexes (Tm ist "melting Point 11 ) und wird 

20 beispielsweise als Tm (Genprodukt-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 
47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen 
eignen sich besonders Ester-, Thioester-, Disulfid-Verbindungen und photolabile 
Verbindungen als spaltbare Verbindungen). 

25 Vorzugsweise gehort die genannte Verbindung zu chemisch oder enzymatisch 
spaltbaren oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren 
Gruppen sind Ester-, Thioester- und Disulfid-Verbindungen bevorzugt („Chemistry of 
protein conjugation and crosslinking" Shan S. Wong 1993 CRC Press Inc., Herman et 
al. Method in Enzymology 1990 v.184 S.584, Lomant et al. J.Mol.Biol. 1976 v.104 

30 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience PubL). 
Beispiele ftir photolabile Verbindungen k6nnen in folgenden Literaturstellen gefunden 
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werden: "Protective groups in organic synthesis" 1991 John Willey & Sons Inc V 
PHlai Synthesis 1980 S.1, V. Pillai Org.Photochem. 1987 v.9 S.225, Dissertation 
„Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" H 
G.egnch, 1996, Konstanz, Dissertation „Neue photolabile Schutzgruppen fQr die 
5 lichtgesteuerte Oligonucleotidsynthese-S.M.BQhler, 1999, Konstanz). 
Die Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise nicht 
werter als 10 Atome von der Base entfemt, noch bevorzugter nicht weiter ais 3 Atome 
Besonders bevorzugt liegt die spaltbare Verbindung oder Gruppe direkt an der Base. 

10 Der Spaltungs- und Entfemungs-Schritt ist in jedem Zyklus vorhanden und muB unter 
milden Bedingungen (s.o.) verlaufen, so dass die Nukleinsauren nicht beschadigt oder 
modifiziert werden. 

Die Spaltung lauft bevorzugt chemisch (z.B. in milder saurer oder basischer 
15 Umgebung for eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittels, 
z.B. Dithiothreitol oder Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbindung), oder physikalisch (z.B. durch Beleuchtung der Oberflache mit Licht einer 
bestimmten Wellenlange fur die Spaltung einer photolabilen Gruppe, Dissertation 
„Neue photolabile Schutzgruppen fOr die lichtgesteuerte Oligonucleotidsynthese" H 
20 Giegrich, 1996, Konstanz) ab. 

Nach der Spaltung verbleibt an der Base ein Linkerrest (A) (Fig.9c). Falls die nach der 
Spaltung am Linkerrest frei gewordene Mercapto-Gruppe weitere Reaktionen st6rt, 
kann sie mit bekannten Mitteln chemisch modifiziert werden (wie z.B. durch Disulfid- 
25 oder lodacetatverbindungen). 

Insgesamt spielen die GroBe, die Ladung und die chemische Struktur des Maricers, 
die Lange des spaltbaren Linkers und des Linker-Rests sowie auch die Wahl der 
Polymerase eine wichtige Rolle. Sie bestimmen gemeinsam, ob das markierte NT* 
30 durch die Polymerase in die wachsende Nukleinsaurekette eingebaut wird, und ob 
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dadurch der Einbau des nSchsten markierten NT* verhindert wird. Zwei Bedingungen 
sind dabei besonders zu berQcksichtigen: 

Einerseits ist es wichtig, dass die Polymerase die Nukleinsaurekette mit dem 
5 eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlSngem kann. 
Es ist also wichtig, dass der Linkerrest "A" (Fig. 9c) nach der Spaltung keine 
wesentliche Stdrung fOr die weitere Synthese darstellt. Andererseits mussen 
eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es konnen viele fur die 
Reaktion geeignete NTs* synthetisiert werden. Im einzelnen muli f£)r jede Kombination 
10 aus Polymerase und NTs* eine Vorversuchsreihe durchgefuhrt werden, in der die 
Tauglichkeit eines bestimmten NT*-Typs fOr die Sequenzierung erprobt wird. 

Die Pufferbedingungen werden nach Angaben des Polymeraseherstellers gewahlt. 
Die Reaktionstemperatur wird ftlr nicht thermostabiie Polymerasen nach Angaben des 

15 Herstellers gewahlt (z.B. 37°C fQr Sequenase Version 2), fGr thermostabiie 
Polymerasen (z.B. Taq-Polymerase) betragt die Reaktionstemperatur maximal den 
Temperaturwert (x). Dieser Temperaturwert (x) hSngt von der Tm des Genprodukt- 
Primer-Komplexes und wird z.B. als Tm (Genprodukt-Primer-Komplex) minus 5°C 
errechnet (z.B. Tm ist 47°C, dann liegt die maximale Reaktionstemperatur bei 42°C). 

20 Diese Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale 
Puffer- und Temperaturbedingungen" bezeichnet. 

Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem Zyklus) betragt 
vorzugsweise weniger als eine Stunde, idealerweise liegt die Reaktionszeit zwischen 
25 10 sec und 10 min. 

Als Beispiele von geeigneten Kombinationen zwischen NT* und Polymerase sind 
folgende Kombinationen zu nennen: 

30 Falls DNA (z.B. cDNA) in die Reaktion eingesetzt wird, k6nnen NT* mit einem kurzen 
Linkerrest (Fig. 9e,h,i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) und /oder mit 
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einem langen Linkerrest (Fig. 9f.gJ): dNTP-SS-TRITC (L14) in Kombination mit 
Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA-DNA-Polymerase 
(Eurogentec) oder Klenow Fragment der DNA-Polymerase I aus E.coli ohne 3'-5' 
Exonukleaseaktivitat (Amersham Pharmacia Biotech) eingesetzt werden. 

5 

Falls RNA (z.B. mRNA) in die Reaktion eingesetzt wird, konnen NT* mit einem kurzen 
Linkerrest (Fig. 9e,h,i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) und / oder NT* mit 
einem langen Linkerrest (Fig. 9f,gj): dNTP-SS-TRITC (L14) in Kombination mit AMV- 
Reverse Transcriptase (Sigma), M-MLV Reverse Transcriptase (Sigma), HIV-Reverse 
10 Transcriptase ohne RNAse-Aktivitat eingesetzt werden. 

Synthesen: 

Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 9f-1) Als 
Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin- 5'-triphosphat, AA- 

15 dUTP, (Sigma) , 3,3'-Dithio-bis(propionsaure- N-Nydroxysuccinimidester), DTBP-NHS, 
(Sigma), 2-Mercaptoethylamin, MEA, (Sigma). Zu 100 pi 50mmol/l Losung von AA- 
dUTP in 100mmol/l Borat-Puffer pH 8.5 werden 3 Aquivalente an DTBP-NHS in DMF 
(25 pi 0.4mol/l Losung) zugegeben. Das Reaktionsgemisch wird 4 Stunden bei RT. 
inkubiert. AnschlieBend wird konz. Ammoniumacetat-LSsung (pH 9) zugegeben bis 

20 die Gesamtkonzentration an CH 3 COONH 4 in der Reaktionslosung 100mmol/l ist, und 
die Reaktion wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch 
200 pi 1mol/l MEA-Losung, pH 9, zugegeben und eine Stunde bei RT inkubiert. 
AnschlieBend wird zu diesem Gemisch solange eine gesSttigte Ldsung an l 2 in 0.3M 
Kl-L6sung zugetropft, bis die Jodfarbe bestehen bleibt. Die modifizierten Nukleotide 

25 werden auf einer DEAE-Cellulose-Saule in Ammoniumcarbonat-Gradient (pH 8.5) von 
anderen Reaktionsprodukten abgetrennt Isolierung des Nukleotids mit dem 
spaltbaren Linker erfolgt auf RP-HPLC. An diesen Linker kdnnen nun Farbstoffe mit 
verschiedenen Methoden gekoppert werden C'Handbook of Fluorescent Probes und 
Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 

30 Method in Enzymology 1995 v.246, S.362, Jameson et al. Method in Enzymology 
1997.V.278.S.363). 
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Auch andere Nukleotidanaloga (z.B. nach Hobbs et a!. US Patent 5,047,519, Khan et 
al. US Patent 5,821,356) konnen in die Reaktion eingesetzt werden, so dass 
Nukleotidanaloga mit Strukturen in Fig. 9f-2,3,4 und 9g-1 ,2 erzeugt werden konnen. 

5 

Als Beispiel der Ankopplung eines Farbstoffe an den Linker wird die Ankopplung von 
TRITC (Tetramethylrhodamin-5-isothiocyanat, Molecular Probes) angegeben (NT*- 
Struktur Fig. 9j): 

10 Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 pi 1 00mmol/l 
Natrium-Borat-Puffer, pH 9, aufgelost (10mmol/l NT*). Dazu werden 10 pi 10mmol/l 
TRITC in DMF gegeben und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff 
modifizierten NT* erfolgt Ober RP-HPLC in Methanol-Wasser Gradient. In ahnlicher 
Weise konnen andere Farbstoffe an die Aminogruppe des Linkers gekoppelt werden. 

15 

Das so hergestellte NT* erfullt die Anforderungen des Einbaus in den DNA-Strang, 
des Fluoreszenznachweises und Kettenabbruchs nach dem Einbau und der 
Aufhebung der Hemmung, die fur das Gelingen des Verfahrens notwendig sind. 

20 Beispiel der Spaltung von Disulfidverbindung im modifizierten NT*. Die Spaltung 
erfolgt durch eine Zugabe von 20 bis 50mmol/l DTT Oder Mercaptoethanol (Sigma) 
Losung pH 8 auf die Reaktionsoberflache. Die Oberflache wird 10 min. mit dieser 
Losung inkubfert, danach wird die Losung entfernt und die Oberflache mit einer 
Pufferlosung zur Entfemung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 

25 

Modifiziertes dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) mit einem kurzen spaltbaren Linker (Fig. 
9e-1). Als Ausgangssubstanzen dienen: Bis-dUTP, synthetisiert nach Hanna (Method 
in Enzymology 1989, v. 180, S.383), 2-Mercaptoethylamine, MEA, (Sigma). 

30 Zu 400 pi 100mmo!/l Bis-dUTP in 40mmol/l Boratpuffer pH 8.5 werden 100pl 
100mmol/l MEA-L6sung, pH 8.5, in H 2 0 zugegeben und 1 Stunde bei RT inkubiert. 
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Anschlieftend wird zu diesem Gemisch solange eine gesattigte Losung an l 2 in 
0.3mol/l Kl-L6sung zugetropft, bis die Jodfarbe bestehen bleibt. Die Nukleotide (Bis- 
dUTP und dUTP-SS-CH 2 CH 2 NH 2 ) konnen z.B. durch eine Ethanol-Prazipitation oder 
auf einer DEAE-Cellulose-Saule in Ammoniumcarbonat-Gradient (pH 8.5) von 
5 anderen Reaktionsprodukten abgetrennt. Bis-dUTP stort bei der anschlieBenden 
Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht, so dass die 
Abtrennung des dUTP-SS-CH 2 CH 2 NH 2 von bis-dUTP im Endreinigungsschritt 
erfolgen kann. 

10 In einer ahnlichen Weise kann auch dCTP (Fig.9-e2) modifiziert werden, dabei dient 
Bis-dCTP als Ausgangssubstanz (synthetisiert nach Hanna et al. Nucleic Acid 
Research 1993, v.21, S.2073). 

Weitere NT* (dUTP* und dCTP*) mit einem kurzen Linkerrest kennen in einer 
15 ahnlichen Weise synthetisiert werden, wobei NT* beispielsweise folgende Strukturen 
aufweisen konnen (Fig.9e): 
dUTP-SS-(CH 2 ) n -NH 2 , Fig.9e-1, 
dCTP-SS-(CH 2 ) n -NH 2l Fig.9e-2, 

wo n zwischen 2 und 6 liegt, vorzugsweise zwischen 2 und 4, weitere Beispiele sind: 
20 dUTP-SS-fCHzVX-CO-fCHzVZ, 
dUTP-SS-(CH 2 ) n -X-CO-Y-(CH 2 ) IT1 -Z, 
dCTP-SS-CCHzJn-X-CO^CHzJm-Z, 

dCTP-SS^CHzJn-X-CO-Y-^HzJm-Z, 
X=NH, O.S 
25 Y=NH.O,S 

Z = NH 2 , OH, Farbstoff 

wo (n + m) zwischen 4 und 10 liegt, vorzugsweise zwischen 4 und 6. 

An den Linker kennen nun Farbstoffe mit verschiedenen Methoden gekoppelt werden 
30 C'Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, 
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R.Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v.246, S.362, 
Jameson et al. Method in Enzymology 1997, v.278, S.363). 

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung des 
5 FluoroLinkTM Cy3 monofunktional dye (Amersham Pharmacia biotech) (NT*-Struktur 
Fig. 9i) angegeben. Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die 
Reaktion wird nach Angaben des Herstellers durchgefuhrt: 

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 pi 100mmol/l 
Natrium-Borat-Puffer pH 8.5 aufgelost. Dazu wird Farbstoff (300nmol) gegeben und 
10 1h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt 
Qber RP-HPLC in einem Methanol-Wasser Gradienten. 

Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker wird die 
Ankopplung von TRITC (Tetramethylrhodamin-5-isothiocyanat, Molecular Probes) 
15 angegeben (dUTP-SS-TRITC Fig.9h). 

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 pi 100mmol/l 
Natrium-Borat-Puffer pH 9 aufgelost (10mmol/l NT*). Dazu werden 10 pi 10mmol/l 
TRITC in DMF gegeben und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff 
20 modifizierten NT* erfolgt Ober RP-HPLC in einem Methanol-Wasser Gradienten. 

Das so hergestellte NT* erfflllt die Anforderungen des Einbaus in den DNA-Strang, 
des Fluoreszenznachweises und Kettenabbruchs nach dem Einbau und der 
Aufhebung der Hemmung, die fOr das Gelingen des Verfahrens notwendig sind. 

25 

Beispiel der Spaltung der Disulfidverbindung im modifizierten NT*. Die Spaltung erfolgt 
durch Zugabe von 20 bis 50mmol/l Dithiothreitol-Losung (DTT) oder Mercaptoethanol- 
Losung (Sigma), pH 8, auf die Reaktionsoberflache. Die Oberflache wird 10 min. mit 
dieser L6sung inkubiert, danach wird die Ldsung entfemt und die Oberflache mit einer 
30 Puffertdsung zur Entfemung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 
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Allgemeine NT-Struktur mit efner an die Ribose bzw. 2-Deoxyribose 
gekoppelten zur Termiantion fiihrenden Gruppe: 

In den Verfahren kennen unterschiedliche NTs verwendet werden (vorzugsweise 
5 2'-deoxy-Nukleotid-Triphosphate), die an ihrer 3'-Position des Riboseringes einen 
Substrtuenten (die zur Termination fuhrende Gruppe) tragen. Dieser Substrtuent 
kann alleine oder zusammen mit dem Fluoreszenzfarbstoff zur Termiantion der 
Embaureaktion fQhren und kann unter milden Bedingngen vom Nukleotid 
abgespalten werden. An diesen Substrtuenten ist ein fur das jeweilige NT* 

10 charakteristischer Fluoreszenzfarbstoff angekoppelt, so dass der Substituent auoh 
die Rolls eines Linkers zwischen dem Nukleotid und dem Fluoreszenzfarbstoff 
ubermmmt. Der Fluoreszenzfarbstoff wird vorzugsweise an diesen Linker durch eine 
unter milden Bedingungen spaltbare Bindung angekoppelt. 
Unter n milden Bedingungen" werden Spaltungsbedingungen verstanden, die weder 

15 zur Denaturierung des Primer-Nukleinsaure-Komplexes fOhren, noch zur Spaltung 
seiner einzelner Bestandteile. 

Formein (1-3) stellen Beispiele fur die reversiblen spaltbaren Terminatoren dar: 

20 1) NT-3'-0-S(1)-F 

2) NT-3*-0-S(2)-N-F 

3) NT-3'-0-S(2)-N-L-F 

NT-3--0 - stellt den 2 , -Deoxy-Nukleosid-Triphosphat-Rest dar 

25 

S(1) - stellt einen Substrtuenten (Formel 1) dar, der unter milden Bidingungen vom 
NT* abgespalten werden kann. An diesen Substrtuenten ist ein 
Fluoreszenzfarbstoff (F) gekoppelt. 

30 S(2)-N - stellt einen werteren Substrtuenten (Formel 2 und 3) dar, der unter 
milden Bidingungen vom NT* abgespalten werden kann. Dieser Substituent ist mit 
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Gruppe <N> vertunden. Der Ruoreszenzfamstoff kann unmittelbar an dh , 
Gmppe (Formel 2, oder durch einem weKeren Linker (L, (Forme! 3) gekoppelt seln. 

Beispieie for NT--Stn J kUi,en, NN^ 2ur Pol vme ras e-W a hl fOr die 
Einbaureakiton , Reaktlonsbedingungen der NTMEhbaureakion und 
Abspafongsreaktion sind in (Kwiatkoxski WO-Patent 01E5247. Kv^atko^ki US- 

5.647.839), Canard et el. (US Patent 6.798.210), Rasoionjatovo (Nucleosides S 
Nucfeo des 1999, v.,8 S.,021). Metzker e, al. (NAR 1994, v.22, S.4259). Welch e, 
el. (Nucleosides & Nucleotides 1999, v.18, S.197) beschrieben. 

Spaltbare Bindung zwischen dem Nukleotld und dem Substituenten, SpeKung- 
Der zur Temrination Kihiende Substituent Ist an das NT dumb eine unter milden 
15 Bedingungen spaltbare Bindung gekoppelt 

Beispiele «r diese Verblndungen stellen Ester und Acetate dar. 

Die Spaltung der Ester eifolgt vonrugsweise im basischen pH-Beielch (Z.B. 9 bis 1 1) 

Die Spaltung von Acetalen erfolgt im saueren Beieich <z.B. zwischen 3 und 4) 

20 ^e! annen aU ° h enZ>ma,iSCh dU,0h P0lymerasen «* - Wfcn 

in einer bevoizugten Ausfohrungsfom, der Erfindung wild der SubsBtuent zusammen 
nut dem Fluoreszenzfcrbstoff In elnem Schritt abgespalten. 

25 Spaltbare Bindung zwischen dem Substituenten und dem Fluoieszenzfarbstoff 
Spaltung: 

In elner anderen bevorzugten Auslilhrungslbrm der Erfindung ist der 
Fluoreszenzfemstoff an den SubsCluenten dumb eine unter m«den Bedingungen 
spaltbare Gruppe gekoppelt. 

30 Vonrugswelse gehan die genannte Gruppe zu Cemisch oder enzymattsch 
spaltbaren oder photolabilen Veibindungen. 
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Ester-, Thioester-, Disulfid-Verbindungen und photolabile Verbindungen eignen sich 
besonders gut als spaltbare Verbindung zwischen dem Substituenten und dem 
Fluoreszenzfarbstoff. 

5 Als Beispiele von chemisch spaltbaren Gruppen sind Ester-, Thioester- und DisulfJd- 
Verbindungen bevorzugt ( n Chemistry of protein conjugation and crosslinking" Shan 
S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v 184 
S.584, Lomant et al. J.Mol.Biol. 1976 v.104 243, "Chemistry of carboxylic acid and 
esters" S.Patai 1969 Interscience Pub..). Beispiete far photolabile Verbindungen 

10 konnen in folgenden Lrteraturstellen gefunden werden: "Protective groups in oroanic 
synthesis" 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 S 1 V Pillai 
Org Photochem. 1987 v.9 S.225, Dissertation „Neue photolabile Schutzgruppen fur 
die hohtgesteuerte O.igonucleotidsynthese" H. Giegnch, 1996, Konstanz, Dfesertation 
.Neu e photolabile Schutzgruppen fOr die lichtgesteuerte Oligonucleotidsynthese" 

15 S.M.BQhler, 1999, Konstanz). 

Der Spaltungsschntt ist in jedem Zyklus vorhanden und muft unter milden 

Bedmgungen verlaufen, so dass die Nukleinsauren nicht beschadigt Oder modrfiziert 
werden. 



20 



D.e Spaltung lauft bevorzugt chemisch (z.B. in milder saurer oder basischer 
Umgebung fOr eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittels 
z B^ Drthiothreito. oder Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbmdung), oder physikalisch (z.B. durch Beleuchtung der Oberflache mit Lioht 
25 emer bestimmten We.len.ange fflr die Spaltung einer photolabilen Gruppe 
Dissertation 0 Neue photolabile Schutzgruppen for die lichtgesteuerte 
OUgonucleotidsynthese" H. Giegnch, 1996, Konstanz) ab. 

In dieser AusfOhrungsform wird nach der Detektion zunachst der 
30 Fluoreszenzfarbstoff abgespalten und erst dann der an die 3'-Posrtion gekoppelte 
zur Termination ftlhrende Substituent. ' 
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Die Erfindung soli an einigen schematischen Figuren weiter verdeutlicht werden. 
Legenden zu Figuren: 

Fig. 1 Eine schematische Darstellung einer Ausfuhrungsform des 
5 Sequenzierautomaten 

101 Lichtquelle fQr Epifluoreszenzmodus 

102 Fukussierungsoptik (1) 

103 Shutter (S1) 

10 1 04 Lichtstrahl des Anregungslichts 

105 Filtersatz bzw. mehrere Filtersatze zur Selektion von Lichtwellenlangen und 
Farbteiler 

106 Objektiv 

1 07 Reaktionsplattform mit 
15 107a Pumpe 

107b VorratsbehSlter 
107cVentile 

1 08 Translationstisch (Scantisch) 

109 Kondensor 
20 110 Spiegel 

111 Shutter (S2) 

112 Fokussierungsoptik (2) 

113 Lichtquelle fQr Transmissionmodus 

114 Lichtstrahl des Transmissionslichts 
25 115Tubus-Optik-1 

116 Detektionsvorrichtung 
Gehause ist nicht gezeigt. 



30 
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Fig. 2 FluRdiagramm mit einem Beispiel fur den Ablauf wesentlicher 

Arbeitsschritte: 



Bei Initialisierung werden durch den Benutzer die Parameter fur die 
5 Sequenzierungsreaktion ausgewahlt. Es werden folgende Parameter eingestellt: 

1) die Art der Untersuchung, z.B. Sequenzierung langer NSKs oder 
Genexpressionsanalyse. 

2) durchschnittliche Lange der immobilisierten NSKs bzw. NSKFs. 

3) durchschnittliche Anzahl der eingebauten NTs pro NSK. 
10 4) Sensitivitat und Spezifitat der Analyse. 

Im Abschnitt prazyklische Reaktionen werden NSKs bzw. NSKFs in MFK in Form 

von NSK-Primer-Komplexen bzw. NSKF-Primer-Komplexen fixiert. Das Ziel dieses 

Abschnittes ist die Immobilisierung der zu untersuchenden Proben in optimaler 

15 Dichte (s. Beispiel Immobilisierung). Die Parameter des Hybridisierungsschrittes 

(Primer und PBS-Zusammensetzung, Lbsungszusammensetzung, optimale 

Hybridisierungs- und Waschtemperatur, Primerimmobilisierungsdichte auf der 

Oberflache, Konzentration der NSKs) sind vorzugsweise bekannt und bestimmen 

zusammen mit der Dauer des Hybridisierungsschrittes die Immobilisationsdichte der 
20 NSKs. 



Im Abschnitt zyklische Reaktionen werden markierte NTs in den komplementaren 
Strang immobilisierter NSKs bzw. NSKFs eingebaut und die Signale von 
eingebauten NTs durch das Abscannen der Reaktionsoberflache detektiert, 
identifiziert und zur jeweils bestimmten NT-Art zugeordnet (Signalverarbeitung). 

Im Abschnitt Datenverarbeitung erfolgt die Zusammensetzung der Sequenzen aus 
einzelnen identifizierten und zugeordneten NTs. 



30 
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Fig. 3 stellt ein "Stand der Technik" Epi-Fluoreszenzmikroskop dar, das in den 
Sequenzierautomaten integriert werden kann. 
1 17 Ableitungsoptik zum Okular 
118Tubus-Optik-2 
5 119 0kular-Optik 

Gehause ist nicht gezeigt. 

Fig. 4a Eine vorteilhafte AusfQhrungsform der Detektionsapparatur. 
Sie zeichnet sich dadurch aus, dass 
10 1) mehrere Filtersatze in einem Filterrevolver Oder Filterschieber 120 angebracht 
sind, 

2) der Scantisch 108, der Filterrevolver oder der Filterschieber 120, der Shutter 103 
und 111 Thermostateinheit, mit der Pumpe und den Steuerungsventilen (in Fig. 
nicht gezeigt) zur Steuerung der Arbeitsschritte mit dem Computer 121 verbunden 
15 sind. 

Zur Fokuseinstellung und Justierung wird in dieser AusfQhrungsform das 
Transmissionslicht verwendet. 

Fig. 4b Diese beispielhafte AusfQhrungsform zeichnet sich durch folgende 
20 Merkmale aus 

Der Sequenzierautomat besitzt eine Vorrichtung (122) zur Intensitatskontrolle und 
Intensitatsregulation des Anregungslichtes. Diese Intensitatsregulierung kann 
beispielsweise durch Anderung der Leistung der Lichtquelle (101) erfolgen. Die 
25 Vorrichtung stellt einen Teil des Regelkreises fQr die Lichtintensitat dar und ist mit 
der zentralen Recheneinheit verbunden. 

2) Zur Fokuseinstellung und fQr die Justierungsbilder wird das Fluoreszenzsignal 
von dem mit der Reaktionsoberflache verbundenen Muster verwendet (s. Beispiel 
30 Detektion). 
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Fig. 5 Ein Beispiel der Detektionsapparatur charakterlsiert dadurch, daB ein Oder 
mehrere Laser (in diesem Beispiel zwei: Laser 123 und Laser 124) als Lichtquellen 
dienen. Diese Laser kflnnen in das Gehause des Sequenzierapparates integriert 
Oder durch Fiberoptik mit dem Sequenzierautomaten verbunden werden. FOr 
5 zeitliche Modulation des Anregungslichtes (die Belichtungszeit liegt vorzugsweise 
zwischen 0.1 msec und 1 sec) wird beispielsweise eine spezielle Vorrichtung 125 
verwendet 

Fig. 6 Beispiele fur die Reaktionsplattform: 

10 

Fig. 6a Eine Obersichtsdarstellung der Reaktionsplattform. Dargestellt ist eine 
AusfQhrungsform mit den vier unterschiedlich markierten NT*s, die gleichzeitig in die 
Einbaureaktion eingesetzt werden. 
201 Befestigungsplatte 
15 202 zufQhrender AnschluB 
203 ableitender AnschluB 
204a Chip mit MFK 
204b MFK 

205 ableitender Schlauch 
20 206 Ventil fOr Pumpe 

« 

207 Pumpe 

208 a,b,c,d zuleitende Schlauche fOr Reaktionslosung NT*(n) 

209 zuleitender Schlauch fQr Waschlosung 

21 0 zuleitender Schlauch fQr ProbenlQsung 
25 211 zuleitender Schlauch fOr Abspaltlosung 

212 a.b.c.d Ventile fQr Reaktionslosung NT*(n) 

213 Ventil fQr Waschlosung 

214 Ventil fQr Probenlosung 

21 5 Ventil fur Abspaltlosung 

30 216 a,b,c,d Vprratsbehaiter fQr ReaktionslSsung NT*(n) 
217 VorratsbehSlter fQr WaschlSsung 
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218 VorratsbehSlter fOr ProbenlSsung 

219 VorratsbehSlter fOr Abspaltlosung 

220 Thermostateinheit 

221 Offnung fQr Transmissionslicht 
5 222 Abdeckplatte 

223 Grundplatte 

224 Sensor 

Fig. 6b Eine Obersichtsdarstellung des Chips mit dem Mikroflussigkeitskanal (MFK). 
10 Der Kanal kann Aufweitungen und Aufspaltungen enthalten, die zur Vergro&erung 
der ReaktionsoberflSche fQhren. Die Auswahl der jeweiligen Form des MFK hangt 
von der Anzahl der Objektfelder ab, die abgescannt werden mQssen: bei einer 
groBen Anzahl wird man MFK mit einer groBeren Reaktionsoberflache einsetzen. 

15 Fig. 6c Eine Obersichtsdarstellung der Verteilungsvorrichtung. Dargestellt ist eine 
AusfOhrungsform mit den vier unterschiedlich markierten NT*s, die gleichzeitig in die 
Einbaureaktion eingesetzt werden. 

Fig. 6d Eine Obersichtsdarstellung der Verteilungsvorrichtung. Dargestellt ist eine 
20 AusfOhrungsform mit den vier markierten NT*s, wobei nur jeweils zwei 
unterschiedlich markierte NTs gleichzeitig in die Einbaureaktion im Zyklus N 
eingesetzt werden. Die anderen zwei werden im Zyklus N+1 eingesetzt. 

Fig. 6e Eine Obersichtsdarstellung der Verteilungsvorrichtung. Dargestellt ist eine 
25 AusfOhrungsform, bei der nur ein NT* pro Zyklus eingesetzt wird, wobei alle vier 
NT*s die gleiche Martoerung tragen. 

Fig. 6f Eine Obersichtsdarstellung der Reaktionsplattform. Dargestelk ist eine 
AusfOhrungsform, bei der ein Sensor 224 den Austausch der L6sungen z.B. optisch 
30 kontrollieren kann. 
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Fig. 7 Schematische Obersichtsdarstellung des Scannvorganges der 
Reaktionsoberflache in einem Zyklus. Dabei werden 2D Bilder (301) von mehreren 
Objektfeldern (302) gemacht. Fluoreszenzsignale (303) einzelner eingebauter NTs 
besitzen charakteristische Koordinaten X(n),Y(n). 

5 

Fig. 8 Detektionsschritt in einer AusfQhrungsform mit 4NT*s (NT* 1,2,3,4), die mit 
verschiedenen Farbstoffen markiert sind 

Nach der Einstellung der X,Y-Koordinaten eines Objektfeldes wird die Fokusposition 
der Reaktionsoberflache Qberpruft bzw. eingestellt. Die OberprQfung erfolgt 
10 beispielsweise im Transmissionslichtmodus, der Shutter S2 (111) ist offen, der 
Shutter S1 (103) ist geschlossen. Danach erfolgt die Aufnahme der 
Fluoreszenzsignale. In diesem Beispiel wird fur jeden Farbstoff ein spezifischer 
Filtersatz (NT (n) ) verwendet, Wahrend der Belichtungszeit ist der Shutter S1 (103) 
offen und der Shutter S2 (111) geschlossen. 

15 

Fig. 9 Beispiele fOr Nukleotid-Strukturen, die im Verfahren eingesetzt werden. 
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AnsprOche: 

Anspruch 1 

Sequenzierautomat, zur parallelen Sequenzierung einer Population einzelner auf 
5 einer planen Oberflache fixierter Nukleinsaurekettenmolekule, wobei diese 
Sequenzierung durch den sequentiellen Aufbau eines zur jeweiligen fixierten 
Nukleinsaurekette komplementaren Stranges mit den mit Fluoreszenzfarbstoffen 
reversibel markierten Nukleotiden stattfindet, wobei dieser sequentielle Aufbau in 
zyklische Reaktionen ablauft. Dieser Sequenzierautomat schlieBt folgende 
10 Elemente ein: 

- Ein optisches System zur Detektion von Signalen von einzelnen Molekulen, das 
folgende Komponenten einschlieBt: 

Eine Quelle der elektromagnetischen Strahlung zur Anregung der 
15 Fluoreszenz von an die modifizierten Nukleotide gekoppelten Farbstoffen, 

Eine Vorrichtung zur Fokusierung der zur Anregung der Fluoreszenz 
eingesetzten elektromagnetischen Strahlung und zum Sammeln emitierter 
elektromagnetischer Strahlung (Fluoreszenzsignale) von einzelnen 
20 FarbstoffmolekQIen, die an die modifizierten in die den zu sequenzierenden 

Nukleinsaureketten komplementaren Strange eingebauten 
Nukleotidmolekulen gekoppelt sind, 

Eine Filtervorrichtung zur Selektion von Wellenlangen der zur Anregung der 
25 Fluoreszenz eingesetzten elektromagnetischen Strahlung und gesammelter 

elektromagnetischer Strahlung (Fluoreszenzsignale), 

- Eine Detektionsvorrichtung zur Detektion der durch die Filtervorrichtung 
selektierter elektormagnetischer Strahlung (Fluoreszenzsignale) von einzelnen 
30 FarbstoffmolekQIen, die an die modifizierten in die den zu sequenzierenden 
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Nukleinsaureketten komplementaren Strange eingebauten NukleotidmolekQIen 
gekoppelt sind, 

- Eine Translationsvorrichtung zur Translation der Reaktionspiattformen beim 
5 Abscannen der OberflSche und zum Wechsei zwischen Reaktionspiattformen 

wShrend der Zyklenschritte, 

- Eine oder mehrere Reaktionspiattformen auf der Translatiorissvorrichtung zur 
Durchfuhrung sequentieller Reaktionszyklen mit immobilisierten Nukleinsaureketten, 

10 wobei diese Plattformen eine gleichzeitige Detektion der Signale von vielen 
einzelnen FarbstoffmoIekQien erlaubt, die an die modifizierten in die den zu 
sequenzierenden Nukleinsaureketten komplementaren Strange eingebauten 
NukleotidmolekQIen gekoppelt sind, 

15 - Ein Gehause zur Halterung von optischem System, Detektionsvorrichtung und 
Translationsvorrichtung 

- Eine Analysevorrichtung zur Bestimmung von Sequenzen fixierter 
Nukleinsaureketten anhand durch die Detektionsvorrichtung detektierter Signale 

20 von einzelnen, modifizierten in die den zu sequenzierenden Nukleinsaureketten 
komplementaren Strange eingebauten NukleotidmolekQIen 

- Eine Steuerungsvorrichtung zur Steuerung: 
a) der Zyklen in der Reaktionsplatform 

25 b) des optischen Systems 

c) der Translationsvorrichtung 

d) der Analysevorrichtung 
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Anspruch 2 

Sequenzierungsautomat nach Anspruch 1 charakterisiert dadurch, dass die zur 
Anregung der Fluoreszenz eingesetzte elektromagnetische Strahlung im 
Epifluoreszensmodus auf die Reaktionsoberflache geleitet wird. 

5 

Anspruch 3 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass 

das optische System, die Translationsvorrichtung und das Gehause Teile eines 

Fluoreszenzmikroskopes sind. 

10 

Anspruch 4 

Sequenzierungsautomat nach Anspruch 1 bis 3 dadurch charakterisiert, dass die 
Quelle der elektomagnetischen Strahlung eine Lampe ist 

15 Anspruch 5 

Sequenzierungsautomat nach Anspruch 4 dadurch charakterisiert, dass die Quelle 
der elektomagnetischen Strahlung eine Quecksilberdampf-Lampe ist 

Anspruch 6 

20 Sequenzierungsautomat nach Anspruch 1 bis 3 dadurch charakterisiert, dass die 
Quelle der elektomagnetischen Strahlung ein oder mehrere Laser sind 

Anspruch 7 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass 
25 Nukleinsaureketten auf einer planen Oberfiache in Form von Nukleinsaureketten- 
Primer-Komplexen fixiert werden 

Anspruch 8 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass mehrere 
30 Fluoreszenzsignale von einzelnen in verschiedenen NSKs bzw. NSKFs 
eingebauten NT*s gleichzeitig detektiert werden. 
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Anspruch 9 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass mehrere 
Nukleinsaureketten gleichzeitig sequenziert werden. 

5 

Anspruch 10 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass er 
folgendes Verfahren zur parallelen Sequenzanalyse von Nukleinsauresequenzen 
(Nukleinsaureketten, NSKs, oder deren Fragmente, NSKFs) ausfuhrt, bei dem man 
0 eine zyklische Aufbaureaktion des komplementaren Stranges der NSKs bzw. 
NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer 
Polymerasen durchfdhrt, indem man 



a) zu den auf der Oberflache gebundenen NSK-Primer-Komplexen bzw. NSKF- 
15 Primer-Komplexen eine Losung zugibt, die eine oder mehrere 

Polymerasen und ein bis vier mddifizierte Nukleotide (NTs*) enthalt, die 
mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstoffe so gewahlt sind, dass sich die verwendeten NTs* 
20 durcn Messung unterschiedlicher Fluoreszenzsignale voneinander unter- 

scheiden lassen, wobei die NTs* strukturell so modifiziert sind, dass die 
Polymerase nach Einbau eines solchen NT* in einen wachsenden kom- 
plementaren Strang nicht in der Lage ist, ein weiteres NT* in denselben 
Strang einzubauen, man 

25 

b) die in Stufe a) erhaltene stationare Phase unter Bedingungen inkubiert, 
die zur Verlangerung der komplementaren Strange geeignet sind, wobei 
die komplementaren Strange jeweils urn ein NT* veriangert weraen, man 
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c) die in Stufe b) erhaltene stationSre Phase unter Bedingungen w§scht, die 
zur Entfernung nicht in einen komplementSren Strang eingebauter NTs* 
geeignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten NTs* durch 
Messen des fUr den jeweiligen Fluoreszenzfarbstoff charakteristischen 
Signals detektiert, wobei man gleichzeitig die relative Position der einzel- 
nen Fluoreszenzsignale auf der Reaktionsoberfiache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKs bzw. NSKFs die Fluo- 
reszenzfarbstoffe und die zur Termination fdhrende Gruppe von den am 
komplementaren Strang angefQgten NTs* abspaltet, man 



f) die in Stufe e) erhaltene stationare Phase unter Bedingungen wascht, die 
zur Entfernung der Fiuoreszenzfarbstoffe und der Gruppe geeignet sind, 
man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 



wobei man die relative Position einzelner NSK-Primer-Komplexe bzw. NSKF- 
Primer-Komplexe auf der Reaktionsoberflache und die Sequenz dieser NSKs bzw. 
NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen 
an den jeweiligen PosWonen detektierten Fluoreszenzsignale zu den NTs bestimmt 
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Anspaich 1 1 

Sequenzierungsautomat nach Anspaich 1 dadurch charakterisiert, dass er 
folgendes Verfahren zur parallelen Sequenzanalyse von NukleinsSuresequenzen 
(NukleinsSureketten, NSKs) ausfuhrt, bei dem man 

5 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer LSnge von etwa 50 bis 1000 
Nukleotiden erzeugt, die Qberlappende Teilsequenzen einer Gesamtsequenz 
darstellen konnen, man 

10 die NSKFs unter Verwendung eines einheitlichen oder mehrerer 
unterschiedlichen Primer in Form von NSKF-Primer-Komplexen auf einer 
Reaktionsoberflache in einer zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges der NSKFs unter 
15 Verwendung einer oder mehrerer Polymerasen durchfOhrt, indem man 

a) zu den auf der Oberfiache gebundenen NSKF-Primer-Komplexen eine 
Losung zugibt, die eine oder mehrere Polymerasen und ein bis vier 
modifizierte Nukleotide (NTs*) enthalt, die mit Fluoreszenzfarbstoffen 

20 markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens 

zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so 
gewahlt sind t dass sich die ven/vendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, 
wobei die NTs* strukturell so modifiziert sind f dass die Polymerase nach 

25 Einbau eines solchen NT* in einen wachsenden komplementaren Strang 

nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, 
man 



30 



b) 



die in Stufe a) erhaltene stationSre Phase unter Bedingungen inkubiert, 
die zur VerlSngerung der komplementaren Strange geeignet sind, wobei 
die komplementaren Strange jeweils urn ein NT* veriangertwerden, man 
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10 



15 



20 



c) die in Stufe b) erhaltene stationare Phase unter Bedingungen wascht, die 
zur Entfernung nicht in einen komplementaren Strang eingebauter NTs* 
geeignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten NTs* durch 
Messen des fQr den jeweiligen Fluoreszenzfartostoff charakteristischen 
Signals detektiert, wobei man gleichzeitig die relative Position der einzel- 
nen Fluoreszenzsignale auf der Reaktionsoberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluoreszenzfarbstoffe 
und die zur Termination fuhrende Gruppe von den am komplementaren 
Strang angeftlgten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter Bedingungen wascht, die 
zur Entfernung der Fluoreszenzfarbstoffe und der Gruppe geeignet sind, 



man 



25 



die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer-Komplexe auf der Reak- 
tonsoberfiache und die Sequenz dieser NSKFs durch spezifische Zuordnung der in 
Stufe d) ,n aufeinanderfolgenden Zyklen an den jeweiligen Positionen detekterten 
Fluoreszenzsignale zu den NTs bestimmt. 



30 
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Ansoruch 1? 

Sequenzierungsautomat nach Anspruch 1 dadurch charakterisiert, dass er 
folgendes Verfahren zur hoch parallelen Analyse der Genexpression ausfQhrt bei 
dem man ' 



einzelstrangige Genprodukte bereitstellt, man 

die Genprodukte unter Verwendung eines einheitlichen oder mehrerer 
unterschiedlichen Primer in Form von Genprodukt-Primer-Komplexen auf einer 
Reaktionsoberflache in einer zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges der Genprodukte 
unter Verwendung einer oder mehrerer Polymerasen durchfuhrt, indem man 

a) zu den auf der Oberflache gebundenen Genprodukt-Primer-Komplexen 
eine Losung zugibt, die eine oder mehrere Polymerasen und ein bis vier 
modifizierte Nukleotide (NTs') enthalt, die mit Fluoreszenzfarbstoffen 
markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens 
zwei NTs* jeweils an den NTs* befindliohen Fluoreszenzfarbstoffe so 
gewahlt sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen 
wobei die NTs* strukturell so modifiziert sind, dass die Polymerase nach 
Einbau eines solchen NT* in einen wachsenden komplementaren Strang 
nicht in der Lage ist, ein weiteres NT in denselben Strang einzubauen, 
man 



b) die in Stufe a) erhaltene stationare Phase unter Bedingungen inkubiert, 
die zur Verlangerung der komplementaren Strange geeignet sind, wobei 
die komplementaren Strange jeweils urn ein NT* verlangert werden, man 
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c) die in Stufe b) erhaltene stationare Phase unter Bedingungen wascht, 
die zur Entfemung nicht |n einen komplementaren Strang eingebauter 
NTs* geeignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten NTs* durch 
Messen des far den jeweiligen Fluoreszenzfarbstoff charakteristischen 
Signals detektiert, wobei man gleichzeitig die relative Position der einzel- 
nen Fluoreszenzsignale auf der Reaktionsoberflache bestimmt, man 

e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte die 
Fluoreszenzfarbstoffe und die zur Termination fOhrende Gruppe von den 
am komplementaren Strang angeftigten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter Bedingungen wascht, 

die zur Entfemung der Fluoreszenzfarbstoffe und der Gruppe geeignet 
sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt-Primer-Komplexe auf der 
Reaktionsoberflache und die Sequenz dieser Genprodukte durch spezrfische 
Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus 
den ermfttelten Teilsequenzen die Identitat der Genprodukte bestimmt. 
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Anspruch 13 

Reaktionsplattform nach Anspruch 1 , zur DurchfQhrung von Reaktionsschritten, die 
folgende Elemente einschieBt: 

Einen austauschbaren Chip mit einem oder mehreren 
5 Mikroflussigkeitskanalen 

Eine Verteilungsvorrichtung zur Steuerung von Losungsaustausches 

im Chip 

Eine Thermostateinheit zur Steuerung der Temperatur im Chip 
10 Anspruch 14 

Sequenzierungsautomat nach Anspruch 1 bis 3 dadurch charakterisiert, dass die 
Quelle der elektomagnetischen Strahlung ein odermehrere Laser-Dioden sind 
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Allgem earner Ablauf der Sequermerungsreaktion 
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BEST AVAILABLE COPY 
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Detektionssdiritt in einer Ausftbrungsform mit 4NT*s (NT* m 4), die mit verschiedenen 
Farbstoffen markiert sind 



Objektfbld-Position (N); 
X,Y-Koordinaten 



Fokus auf die 
Reaktionsoberflache 



nein 



Filtersatz NT* (1) 



FiltexsalzNT*(2). 
? 



AufiiahmeNT*^) 



Filtersatz NT*^ 
* 



Au&ahme NT*<3) 



Filt 



:NT*(4) 
AufhahmeNT* 



Autofokus 



j 




Signalverarbeitung 



Justierungsbild fQr 
Objektfeld (N) 



N+l 

Objektfeldposition 
* 





nein 




WO 03/031947 PCTYEP02/1 1098 





Legende: 

A, C, E - Verbindungselemente irn Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Fluoreszenzfarbstoff (Marker) 



* 
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eingebaute modifizierte NTs* nach der Spaltung 




Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fuhrende Gruppe 
F - Fluoreszenzf arbstoff (Marker) 
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